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Kurzfassung 


Die Verwendung von technisch kognitiven Systemen, welche den Menschen 
bei der Ausführung von alltäglichen Aufgaben unterstützen, nimmt über die 
letzten Jahre stetig zu. Häufig müssen solche Systeme in der Lage sein, eine 
für ihre Aufgaben relevante Umgebung sensorisch erfassen und verarbei- 
ten zu können. Zu diesem Zweck können sog. Umweltmodelle eingesetzt 
werden, deren Aufgabe eine konsistente Integration, Verwaltung und Be- 
reitstellung erfasster Umgebungsinformationen ist. Ein Beispiel eines sol- 
chen Umweltmodells ist das sog. objektorientierte Umweltmodell, welches 
nach probabilistischen Prinzipien operiert und schritthaltend den Zustand 
einer beobachteten Umgebung darstellt. Diese sensorbasierte Beschreibung 
wird dabei durch ein semantisches Domänenmodell ergänzt, in welchem als 
Hintergrundwissen relevante Typen von Entitäten der Umgebung modelliert 
werden. Derartige Domänenmodelle werden im Allgemeinen zur Entwurfs- 
zeit eines Systems von Wissensingenieuren manuell erstellt. Sie beschreiben 
somit immer nur einen abgeschlossenen Teil einer Anwendungsdomäne. 


In dieser Arbeit wird nun der Fall betrachtet, dass ein solch abgeschlosse- 
nes Domänenmodell für die Umweltmodellierung nicht mehr ausreichend ist 
und dynamisch erweitert werden muss. Dabei wird von einer offenen Welt 
ausgegangen, d.h. einer Umgebung, in welcher auch nicht im Domänenmo- 
dell beschriebene Entitäten beobachtet werden können. Zu diesem Zweck 
wird in dieser Arbeit der Ansatz einer adaptiven Umweltmodellierung defi- 
niert, welcher es einem Umweltmodell ermöglicht, dynamisch auf unvorher- 
gesehene Entitäten reagieren zu können. In diesem Ansatz können Wissens- 
modelle adaptiv durch das Erlernen neuer Konzepte erweitert werden. Um 
eine adaptive Umweltmodellierung zu ermöglichen, werden in dieser Arbeit 
unterschiedliche Aspekte und Methoden der probabilistischen Informations- 
verarbeitung im objektorientierten Umweltmodell angepasst und erweitert. 


Kurzfassung 


Als Grundlage zur Repräsentation von neu gelernten Konzepten werden zu- 
nachst ein formales Metamodell und eine Kern-Ontologie definiert, welche 
die strukturierte Erweiterung eines Domänenmodells durch das Erlernen 
neuer Konzepte ermöglichen. Dabei muss im Besonderen die probabilisti- 
sche Informationsrepräsentation des Umweltmodells beachtet werden, die 
eine Erweiterung von logisch orientierten Repräsentationsansätzen notwen- 
dig macht. Weiterhin wird ein probabilistischer Klassifikationsansatz vorge- 
schlagen, welcher beobachteten Entitäten ihre im Domänenmodell model- 
lierten Typen unter Verwendung einer Wahrscheinlichkeitsverteilung zu- 
ordnet. Dieser Ansatz kann ebenfalls bei der Erkennung von unvorhergese- 
henen Entitäten genutzt werden. 


Als Hauptbeitrag dieser Arbeit wird ein Ansatz zur adaptiven Verwaltung 
und Erweiterung von Domänenmodellen präsentiert. Eine solche Erweite- 
rung soll dabei nach Prinzipien wie der Bedarfsgerechtigkeit und Relevanz 
von Modellanpassungen erfolgen. Um den Bedarf einer Modellanpassung in 
einem Umweltmodell feststellen zu können, werden in dieser Arbeit Bewer- 
tungsmaße definiert, welche zur Quantifizierung der Modellgüte in Bezug 
auf die beobachtete Umgebung dienen. Diesen Bewertungsmaßen liegt ein 
Ansatz auf Basis des Prinzips der minimalen Beschreibungslänge zu Grunde. 
Unter Verwendung dieser Bewertungsmaße wird ein algorithmisches Rege- 
lungsschema definiert, welches die bedarfsgetriebene Anpassung eines Do- 
mänenmodells an relevante unvorhergesehene Entitäten erlaubt. Dazu wer- 
den weitere Bewertungsmaße definiert, welche die Detektion, Relevanzbe- 
wertung und Gruppierung solcher Entitäten ermöglichen. Auf Basis einer 
relevanten Gruppe von Entitäten, die einen spezifischen, bisher nicht mo- 
dellierten Typ repräsentiert, kann dann eine Modellanpassung erfolgen. Als 
ein weiterer Beitrag wird daher ein Ansatz zum Lernen und Generalisieren 
von probabilistischen Konzeptdefinitionen vorgeschlagen. Abschließend er- 
folgt eine Evaluation der vorgeschlagenen Ansätze und Bewertungsmaße als 
Nachweis ihrer grundsätzlichen Anwendbarkeit an einem abstrahierten An- 
wendungsszenario der humanoiden Robotik für eine Haushaltsumgebung. 
Insgesamt beschreibt diese Arbeit somit einen ersten, aber grundlegenden 
Schritt in Richtung einer adaptiven Umweltmodellierung. 
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1 Einleitung 


1.1 Motivation 


In vielen Bereichen und Anwendungen nimmt über die letzten Jahre der Ein- 
satz von technisch kognitiven Systemen zu, welche den Menschen bei all- 
täglichen Aufgaben unterstützen. Derartige Systeme reichen in ihrer Band- 
breite von Assistenz- und Überwachungssystemen, wie sie z.B. in der Pfle- 
ge oder im Bereich der Sicherheit eingesetzt werden, über Assistenzfunk- 
tionen im Bereich des unterstützten Fahrens bis hin zur Servicerobotik, wo 
z. B. Roboter Alltagsaufgaben übernehmen. Zur Erfüllung solcher Unterstüt- 
zungsfunktionen müssen kognitive Systeme in der Lage sein, eine für ihre 
Aufgaben relevante Umgebung sensorisch erfassen, verarbeiten, interpretie- 
ren und speichern zu können. Dabei muss sowohl der Zustand einer Umge- 
bung erfasst als auch dessen Bedeutung für den menschlichen Alltag adäquat 
interpretiert und verstanden werden. Zu diesem Zweck können sog. Um- 
weltmodelle eingesetzt werden. Zu den Aufgaben der Umweltmodellierung’ 
zählt dabei die konsistente Integration und Verwaltung erfasster Informatio- 
nen, deren Verknüpfung mit Hintergrundwissen sowie deren anschließende 
bedarfsgerechte Bereitstellung an andere Komponenten eines technisch ko- 
gnitiven Systems. 


Sollen aufgrund eines erfassten Umgebungszustandes (semi-) automatisiert 
Entscheidungen getroffen oder Handlungen abgeleitet werden, so ist es es- 
sentiell, dass die Bedeutung von beobachteten Objekten und Ereignissen so- 
wie die Beziehungen zwischen diesen formal repräsentiert werden, z.B. un- 
ter Verwendung eines Wissensmodells. Eine solche Anforderung ergibt sich 


* auch als Welt-, Umfeld- oder Umgebungsmodellierung bezeichnet 


1 Einleitung 


fiir verschiedene technisch kognitive Systeme, darunter kognitive Assistenz- 
systeme zur Entscheidungsunterstiitzung sowie Serviceroboter. 


Die Erstellung solcher Wissensmodelle ist ein zeitaufwendiger Prozess, der 
von Wissensingenieuren in Zusammenarbeit mit Domänenexperten durch- 
geführt wird. Heutzutage kann dieser Prozess durch Werkzeuge unterstützt 
werden. Sollen allerdings bestimmte Qualitätsanforderungen eingehalten 
werden, wie z.B. die Konsistenz, Nachvollziehbarkeit oder Erweiterbarkeit 
eines Wissensmodells, so ist dieser Prozess weiterhin mit manuellem Auf- 
wand verbunden. Erstellte Domänenmodelle sind, aufgrund verschiedener 
Bedingungen, in ihrem Umfang endlich. Einer der Gründe ist der Zeitauf- 
wand ihrer Erstellung, weitere Gründe sind u.a. der gewählte Fokus eines 
Modells sowie vorab verfügbare Informationen. Jedes Modell ist somit seiner 
Natur nach abgeschlossen. Dies steht in vielen Anwendungsbereichen von 
technisch kognitiven Systemen einer prinzipiell offenen, sich verändernden 
Welt gegenüber. Auch wenn nur ein bestimmter Ausschnitt der Welt in 
einer Anwendungsdomäne betrachtet wird, so besteht die Möglichkeit, dass 
zu einem Zeitpunkt Objekte oder Ereignisse auftreten und erfasst werden, 
welche nicht in einem Wissensmodell beschrieben sind. 


Um einem technisch kognitiven System einen geordneten Umgang mit einer 
solchen Situation zu ermöglichen, beschäftigt sich diese Arbeit mit der The- 
matik einer adaptiven Umweltmodellierung für offene Welten. Die adaptive 
Umweltmodellierung soll es dabei ermöglichen, existierende Wissensmodel- 
le bei Bedarf an die erfassten Umgebungsbedingungen anzupassen, indem 
diese Wissensmodelle nach bestimmten Prinzipien um neue, dynamisch de- 
finierte Konzepte erweitert werden. Grundlage einer solchen Anpassung ist 
dabei die quantitative Bewertung von Wissensmodellen in Bezug auf ihre 
Fähigkeit, die aktuell in einer Umgebung beobachteten Entitäten beschrei- 
ben zu können. 


1.2 Ausgangssituation und Anwendungsbeispiel 


1.2 Ausgangssituation und 
Anwendungsbeispiel 


Der in dieser Arbeit erweiterten Umweltmodellierung liegt ein spezifischer 
Ansatz zu Grunde. Ausgangspunkt sind die objektorientierte Umweltmodel- 
lierung [Bey07] und die Ansätze des in Abbildung 1.1 dargestellten objekt- 
orientierten Umweltmodells (OOWM) [Emt08, Bau09, Ghe10b, Hei10]. Die- 
ser Ansatz beschreibt ein domänen-agnostisches Vorgehen zur Umweltmo- 
dellierung, in welchem aktuelle Zustandsinformationen über eine betrach- 
tete Umgebung repräsentiert und mit einem semantischen Wissensmodell 
verknüpft werden. Der Fokus liegt dabei auf der Repräsentation der relevan- 
ten Objekte einer betrachteten Domäne. Das objektorientierte Umweltmo- 
dell dient als Gedächtnismodell oder Informationsdrehscheibe innerhalb von 
technisch kognitiven Systemen. Die Verarbeitung und Repräsentation von 
Informationen folgt dabei den Prinzipien einer probabilistischen Informati- 
onsverarbeitung. Dies resultiert aus dem Grundsatz der objektorientierten 
Umweltmodellierung, auftretenden Unsicherheiten explizit Rechnung tra- 
gen zu können. Solche Unsicherheiten können z.B. bei der messtechnischen 
Erfassung von Objekten und ihrer Eigenschaften durch Sensoren entstehen, 
ebenso bei der Verarbeitung von Informationen sowie bei der Modellierung 
von Vorwissen. Objekte werden dabei mittels probabilistischer Attribute im 
Umweltmodell repräsentiert, welche die durch Sensoren beobachteten Ei- 
genschaften beschreiben. Diese Objekte werden mit einem semantischen 
Wissensmodell verknüpft, für welches in der objektorientierten Umweltmo- 
dellierung eine manuelle Erstellung durch Wissensingenieure angenommen 
wird. Da die objektorientierte Umweltmodellierung zur Anwendung in ver- 
schiedenen Domänen konzipiert ist, muss auch die zu entwickelnde adapti- 
ve Umweltmodellierung für offene Welten domänen-agnostisch entworfen 
werden. Weiterhin muss in dieser Arbeit die probabilistische Informations- 
darstellung und -verarbeitung beachtet werden. 


1 Einleitung 


Weltmodell Hintergrundwissen 


Attribut 1 Attribut 1 
Attribut 2| | Attribut 2 
Attribut 3 Attribut 3 


Abbildung 1.1: Überblick über die objektorientierte Umweltmodellierung. Das Umweltmodell 
besteht aus den beiden Anteilen Weltmodell und Hintergrundwissen. Im Welt- 
modell werden Objekte der realen Welt durch Repräsentanten (Rep1, Rep2 etc.) 
dargestellt. Im Hintergrundwissen werden Typen von Objekten durch hierar- 
chisch geordnete Klassen modelliert. 


Abbildung 1.1 stellt das objektorientierte Umweltmodell als eine Komponen- 
te im Überblick dar. Es besteht dabei auch zwei Anteilen: Das Weltmodell ist 
dabei zuständig für die Repräsentation des aktuellen Umgebungszustandes, 
das Hintergrundwissen stellt formalisiertes Vorwissen bzgl. der Domäne be- 
reit und definiert somit die Semantik der im Weltmodell repräsentierten In- 
formationen. Beobachtete Informationen bzgl. des betrachteten Ausschnitts 
der realen Welt werden durch Sensoren erfasst. Im Weltmodell findet eine 
objektorientierte Fusion dieser Informationen statt, welche potenziell aus 
heterogenen Quellen stammen können. 


Die objektorientierte Umweltmodellierung abstrahiert dabei heterogene 
Sensordaten explizit zu einer einheitlichen und integrierten Darstellung 
der enthaltenen Informationen im Weltmodell. Diese werden in Form von 
Attributen dargestellt, welche beobachtete Eigenschaften von Objekten 
probabilistisch beschreiben. Informationen im Weltmodell werden schritt- 
haltend mit neuen Sensordaten aktualisiert. Vorherige Umgebungszustände 
werden dabei in einer Zustandshistorie persistiert. 


Die im Hintergrundwissensmodell enthaltenen Informationen dienen dazu, 
zusätzliche, z. B. mittels der Sensorik nicht beobachtbare Fakten und Zusam- 
menhänge bereitzustellen und Schlussfolgerungen ziehen zu können. Dieses 
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verknüpfte Wissen wird schließlich für weitere Komponenten eines tech- 
nisch kognitiven Systems, z.B. für eine Situationsanalyse, vom objektori- 
entierten Umweltmodell zur Verfügung gestellt. Um die im Weltmodell re- 
präsentierten Objekte mit entsprechenden Klassen im Hintergrundwissen 
verknüpfen zu können, werden die Objekte mittels eines probabilistischen 
Ansatzes klassifiziert. 


Das objektorientierte Umweltmodell ist zur Anwendung in unterschiedli- 
chen Domänen konzipiert und wurde bisher z.B. zur Unterstützung von Si- 
tuationsbewusstsein in Überwachungssystemen [Bau09, Fis16] oder im Be- 
reich der Servicerobotik [Bel17] eingesetzt. Die in dieser Arbeite entwickel- 
ten Methoden zur Erweiterung des objektorientierten Umweltmodells für of- 
fene Welten sind ebenfalls domänen-agnostisch konzipiert. Um die Anwend- 
barkeit der Methoden zu demonstrieren und auch durch konkrete Anwen- 
dungen zu veranschaulichen, werden an passenden Stellen Anwendungsbei- 
spiele gegeben. Diese Anwendungsbeispiele entstammen dabei dem Bereich 
der humanoiden Servicerobotik und nutzen ein häufiges Anwendungsszena- 
rio, in welchem ein kognitives System bei der Ausführung von häuslichen 
Alltagsaufgaben unterstützen soll. 


1.3 Spezifische Zielsetzung und 
Forschungsfragen 


Das Ziel dieser Arbeit ist die Erweiterung des Ansatzes der objektorien- 
tierten Umweltmodellierung für offene Welten. Dabei soll die Umweltmo- 
dellierung in die Lage versetzt werden, mit unvorhergesehenen Arten von 
Objekten umgehen und sich bedarfsgerecht an diese anpassen zu können, 
indem neue Konzepte erlernt und in das genutzte Hintergrundwissensmo- 
dell aufgenommen werden. In bisherigen Arbeiten zum objektorientierten 
Umweltmodell wurden vor allem die Weltmodell-Komponente und ih- 
re probabilistische Informationsverarbeitung detailliert betrachtet. Die 
Hintergrundwissens-Komponente wurde allgemein beschrieben und nur 
bzgl. einzelner Aspekte beispielhaft umgesetzt. Um ein domänen- und 


1 Einleitung 


anwendungsunabhängiges Vorgehen zur Erweiterung von Hintergrundwis- 
sensmodellen entwerfen und umsetzen zu können, muss zunächst dessen 
allgemeine Struktur prinzipiell und formal festgelegt werden. Dies defi- 
niert das Grundgerüst, innerhalb welchem ein Wissensmodell angepasst 
und neue Konzepte gelernt werden können. Als erste Fragestellung wird 
somit betrachtet, 


e auf welche Weise ein Hintergrundwissensmodell für die objektorien- 
tierte Umweltmodellierung strukturiert, organisiert, und repräsentiert 
werden kann. Dabei müssen auch die Anforderungen, die in Vorarbei- 
ten an das Hintergrundwissen gestellt wurden, beachtet werden. 


Auf Basis einer entsprechenden Festlegung kann dann die übergeordnete 
Forschungsfrage betrachtet werden, 


« wie eine bedarfsgerechte, nachvollziehbare Anpassung eines Hinter- 
grundwissensmodells durch das Erlernen neuer relevanter Konzepte 
auf Basis von Beispielen erfolgen kann. 


Dabei wird die Situation als Ausgangspunkt angenommen, dass im Betrieb 
des objektorientierten Umweltmodells Objekte in der betrachteten Umge- 
bung beobachtet werden, für welche bisher keine Klassen im Hintergrund- 
wissensmodell hinterlegt sind. Diese Situation stellt den Treiber dar, wel- 
cher Anpassungen im Wissensmodell veranlasst. Dabei ist es eine der Anfor- 
derungen an eine adaptive Umweltmodellierung, dass solche Anpassungen 
bedarfsgerecht erfolgen. Eine weitere Anforderung ist, dass nur relevante 
neue Konzepte in das Hintergrundwissensmodell übernommen werden. Bei- 
de Anforderungen sind aus menschlichen Erfahrungswerten motiviert und 
dienen dazu, unkontrollierte bzw. hochfrequente Anpassungen zu vermei- 
den und eine gewisse Steuerbarkeit und Nachvollziehbarkeit in die adaptive 
Umweltmodellierung aufzunehmen. 


Als eine Randbedingung muss dabei davon ausgegangen werden, dass für 
das Erlernen neuer Konzepte nur eine relativ geringe Menge von Lernbei- 
spielen zur Verfügung steht, nämlich die bisher beobachteten Objekte. 


1.4 Eigene Beitrage 


Die zuvor genannte übergeordnete Forschungsfragestellung kann somit in 


folgende Teilfragen aufgeteilt werden: 


Wie lässt sich der Bedarf für die Anpassung des Hintergrundwissens- 
modells beschreiben und erfassen? Dabei besteht auch ein Bezug zu 
den im Weltmodell repräsentierten Entitäten. Wie kann weiterhin 
quantitativ bewertet werden, wann Bedarf für eine Anpassung des 
Hintergrundwissensmodells besteht? 

Wie wird erkannt, welche im Weltmodell repräsentierten Entitäten 
bisher keinem der modellierten Konzepte des Hintergrundwissens zu- 
geordnet werden können? 

Wie kann bewertet werden, dass ein Typ bisher nicht modellierter En- 
titäten relevant für eine Aufnahme ins Hintergrundwissen ist? 

Wie kann auf Basis von wenigen Beispielen solcher Entitäten ein ge- 
neralisierendes Konzept für das Hintergrundwissen gelernt werden? 
Wie kann ein neu gelerntes Konzept in ein potenziell hierarchisches 
Hintergrundwissensmodell eingeordnet werden und wie können wei- 
tere, nicht aus Sensordaten ableitbare Eigenschaften für dieses Kon- 
zept gelernt werden? 


Diese Fragestellungen werden in dieser Arbeit betrachtet. Ziel ist es dabei, 


Verfahren und Gütemaße zu entwickeln, mit deren Hilfe Antworten auf die 


genannten Fragen gegeben und Lösungen demonstriert werden können. 


1.4 


Eigene Beiträge 


Die Beiträge dieser Arbeit lassen sich unterscheiden in Anteile, die direkt 


Verfahren für eine adaptive Umweltmodellierung betreffen, und solche, wel- 


che zur Ermöglichung der Ersteren die objektorientierte Umweltmodellie- 


rung wo notwendig vervollständigen, anpassen und erweitern. Die Beiträ- 


ge zur adaptiven Umweltmodellierung ergänzen die Forschung an Umwelt- 


modellen dabei um neuartige Aspekte wie eine quantitative Qualitäts- bzw. 


1 Einleitung 


Nützlichkeitsbewertung für Wissensmodelle sowie deren adaptive Erweite- 


rung durch das Erlernen neuer Objektklassen innerhalb des Rahmens der 


objektorientierten Umweltmodellierung. Diese Beiträge betreffen: 


ein Maß zur Bewertung der Qualität eines Wissensmodells in Bezug 
auf den aktuell im Weltmodell repräsentierten Umgebungszustand 
[Kuw13a, Kuw12a] (Kapitel 7), 
einen Ansatz zur adaptiven Anpassung von Wissensmodellen (Kapi- 
tel 8), mit den Anteilen: 
— verschiedene Maße zur Identifikation von schlecht durch ein Do- 
mänenmodell repräsentierten Objekten [Kuw13b, Kuw16], 
-— ein Ansatz zur Beurteilung der Relevanz neuer Objektklassen 
von schlecht repräsentierten Objekten [Kuw14], 
- ein Verfahren zum Erlernen neuer probabilistischer Objektklas- 
sen aus beobachteten Objekten [Kuw13b, Kuw14]. 
Ein zusätzlicher Beitrag ist die probabilistische Modellierung eines 


Evaluationsszenarios mit interpretierbaren Objektattributen [Kuw16] 
(Abschnitt 8.5.1). 


Weiterhin wurde der Ansatz der objektorientierten Umweltmodellierung an 


vielen Stellen ergänzt, vervollständigt und erweitert. Die wesentlichen eige- 


nen Beiträge betreffen hierbei: 


ein Metamodell zur strukturierten Informationsrepräsentation von 
Hintergrundwissen im objektorientierten Umweltmodell [Kuw13c, 
Bel12c] (Kapitel 4), 


erweiterte Formalisierung der mathematischen Repräsentation des 
objektorientierten Umweltmodells (z.B. [Kuw13a]) (Kapitel 5 & 7), 
neuartiger Ansatz für eine probabilistische Klassifikation von im Welt- 
modell repräsentierten Objekten [Kuw13b, Kuw16] (Kapitel 6), 
Erweiterung des Ansatzes [Bau10] zur Objektidentifikation (Datenas- 
soziation) im objektorientierten Umweltmodell (Kapitel 5). 


1.5 Gliederung der Arbeit 


1.5 


Gliederung der Arbeit 


Diese Arbeit ist im Weiteren wie folgt gegliedert: 


Kapitel 2 ordnet die Anteile dieser Arbeit in unterschiedliche Themen- 
gebiete ein und gibt einen Überblick über den für diese Arbeit relevan- 
ten Stand von Technik und Wissenschaft in diesen Gebieten. 


Kapitel 3 präsentiert allgemein die Problemstellung und das Vorgehen 
der adaptiven Umweltmodellierung und gibt einen Überblick über die 
objektorientierte Umweltmodellierung. 


In Kapitel 4 wird die entwickelte allgemeine Struktur für Hinter- 
grundwissensmodelle der objektorientierten Umweltmodellierung 
vorgestellt sowie als ein Beispiel für diese Struktur ein spezifisches 
Hintergrundwissensmodell für die Haushaltsdomäne. 


In Kapitel 5 wird detailliert auf die probabilistische Informationsver- 
arbeitung des objektorientierten Umweltmodells eingegangen. 

In Kapitel 6 wird die entwickelte probabilistische Repräsentant-zu- 
Konzept Zuordnung vorgestellt. 

Kapitel 7 stellt den entwickelten Ansatz zur quantitativen Bewertung 
eines Hintergrundwissensmodells in der Umweltmodellierung vor. 
Kapitel 8 präsentiert den übergeordneten Ansatz zur adaptiven An- 
passung und Verwaltung eines Hintergrundwissensmodells. 

In Kapitel 9 wird die Arbeit schließlich zusammengefasst und ein Aus- 


blick gegeben. 


2 Stand der Technik und 
Wissenschaft 


In diesem Kapitel wird zusammenfassend der fiir die vorliegende Arbeit rele- 
vante Stand der Technik und Wissenschaft dargestellt. Zusatzlich beinhalten 
einzelne Kapitel weitere Referenzen zu verwandten Ansätzen. 


Die Umweltmodellierung zeichnet sich durch eine querschnittliche Natur 
aus. Umweltmodelle sind i. A. dafür ausgelegt, als eine Komponente inner- 
halb eines komplexeren Systems zu dienen und so in verschiedenen Anwen- 
dungsbereichen eingesetzt zu werden. Auch methodisch werden in der Um- 
weltmodellierung Verfahren aus unterschiedlichen wissenschaftlichen und 
ingenieurstechnischen Themengebieten genutzt. In der vorliegenden Arbeit 
als einer Erweiterung der Umweltmodellierung ist diese querschnittliche Na- 
tur ebenfalls gegeben. Entsprechend werden Methoden und Verfahren aus 
unterschiedlichen Themengebieten betrachtet und eingesetzt. Dieses Kapitel 
legt den Stand der Technik und Wissenschaft nun für die relevanten Anteile 
dieser Themengebiete mit Bezug zur adaptiven Umweltmodellierung und zu 
Teilen der objektorientierten Umweltmodellierung dar. Vorausgehend wird 
zunächst eine thematische Einordnung dieser Arbeit und der adaptiven Um- 
weltmodellierung im Speziellen vorgenommen. 
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2 Stand der Technik und Wissenschaft 


2.1 Einordnung der Arbeit 


Die adaptive Umweltmodellierung betrachtet die dynamische Reprasenta- 
tion von Wissen bzgl. einer Domäne und der in ihr beobachteten Objek- 
te. Dabei wird auf der probabilistischen Informationsdarstellung der objekt- 
orientierten Umweltmodellierung aufgesetzt und es werden Repräsentatio- 
nen von Sensordaten zu symbolischem Wissen in Beziehung gesetzt. Adap- 
tive Anpassungen an einem Wissensmodell erfordern weiterhin das Erler- 
nen neuer Klassen aus wenigen Beispielen. Somit sind insgesamt die folgen- 
den Themengebiete für die adaptive Umweltmodellierung bzgl. inhaltlicher 
Überschneidungen relevant: 


e Wissensmodellierung und -repräsentation, inklusive Ansätzen zur 
logisch-probabilistischen Modellierung‘, 


« Konzept- und Taxonomielernen, inklusive Aspekten aus kognitiven 
Architekturen, 


e probabilistische Informationsverarbeitung und Zustandsschätzung 


e sowie maschinelles Sehen. 


Nachfolgend wird die adaptive und allgemeine Umweltmodellierung in Re- 
lation zu den genannten Themengebieten gesetzt und deren Relevanz für 
diese Arbeit zusammenfassend dargestellt. 


Wissensmodellierung und -repräsentation Dieses Gebiet beschäftigt 
sich mit der Modellierung und formalen Repräsentation von Wissen über 
eine betrachtete Anwendungsdomäne. Dazu wird über eine Domäne vor- 
handenes Hintergrundwissen erfasst, analysiert, strukturiert und derart for- 
mal repräsentiert, dass es in Systemen gewinnbringend zur Anwendung ge- 
bracht werden kann. In der Umweltmodellierung werden gängige Ansätze 
der Wissensrepräsentation genutzt, um ein Umweltmodell mit relevantem 
Hintergrundwissen über die betrachtete Umgebung auszustatten. Abschnitt 
2.2 stellt die Grundlagen dieses Gebiets dar und Abschnitt 2.3 betrachtet als 


Beinhaltet: prädikatenlogisch-probabilistische Sprachen, probabilistisch-relationale Modelle, 
statistisch-relationale Ansätze usw. 
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verwandte Ansätze existierende Modelle, welche bereits formalisiertes Wis- 
sen über bestimmte Anwendungsdomänen enthalten. 


Logisch-probabilistische Modellierung In diesem Gebiet werden eben- 
falls Domänenmodelle erstellt. Im Vergleich zur allgemeinen Wissensmo- 
dellierung liegt der Schwerpunkt der erstellten Modelle hier allerdings auf 
der Ermöglichung von probabilistischen Schlussfolgerungen. Zur Darstel- 
lung komplexer Domänen werden logikbasierte Repräsentationssprachen 
mit probabilistisch-graphischen Modellen kombiniert, wodurch die Berück- 
sichtigung von Unsicherheiten ermöglicht wird. Ähnlich zur objektorien- 
tierten Umweltmodellierung verwenden viele Repräsentationssprachen ei- 
nen objektbasierten Ansatz zur Domänenmodellierung. Die Darstellung von 
unsicherem Wissen in der logisch-probabilistischen Modellierung ist rele- 
vant für die objektorientierte Umweltmodellierung. Die Aspekte des proba- 
bilistischen Schlussfolgerns sind eher für der Umweltmodellierung nachge- 
lagerte Komponenten relevant, z.B. eine Situationsanalyse. Das Themenge- 
biet der logisch-probabilistischen Modellierung wird ebenfalls in Abschnitt 
2.2 dargestellt. 


Konzept- und Taxonomielernen Dies ist ein Thema, das allgemein für die 
Anpassung eines Hintergrundwissensmodells auf Basis von Beispieldaten 
relevant ist. Dabei sind mehrere Teilgebiete betroffen, wie etwa das klas- 
sische Konzeptlernen, konzeptuelles Clustern, die numerische Taxonomie, 
perzeptive Verankerung oder das textbasierte Lernen von Ontologien. Auf 
diese Aspekte wird in Abschnitt 2.4 eingegangen. Weiterhin finden sich Ähn- 
lichkeiten auch im Gebiet der kognitiven Modellierung, speziell bei kogni- 
tiven Architekturen. 


Kognitive Modellierung Dieses Forschungsgebiet beschäftigt sich mit 
der Erforschung und Modellierung von kognitiven Prozessen beim Men- 
schen. Dabei werden auch computergestützte Modelle verwendet und 
entsprechend künstliche kognitive Systeme umgesetzt. Die betrachte- 
ten Problemstellungen ähneln in Teilen denen der Umweltmodellierung, 
nämlich beispielsweise die Fragestellungen, wie Umgebungsobjekte vom 
Menschen erfasst und repräsentiert werden, wie ihnen Bedeutung zugeord- 
net wird und wie allgemein das Ziehen von Schlussfolgerungen auf Basis 
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solcher Beobachtungen ablauft. Dabei stehen im Vergleich zur Umweltmo- 
dellierung andere Zielsetzungen im Vordergrund, wie das Verstehen von 
menschlichem Verhalten, so dass die genannten Aspekte rein als Teilpro- 
bleme und nur aus einer menschzentrierten Perspektive betrachtet werden. 
Die genutzten Prinzipien können allerdings auch für die adaptive Umwelt- 
modellierung nützlich sein und als Inspiration dienen. Dieses Themengebiet 
wird ebenfalls in Abschnitt 2.4 behandelt. 


Probabilistische Informationsverarbeitung In der Umweltmodellierung 
muss der Zustand der über Sensoren wahrgenommenen Umgebung reprä- 
sentiert und schritthaltend mit neuen Beobachtungen mitgeführt werden. 
Dies ist Teil der probabilistischen Informationsverwaltung im Weltmodell 
der objektorientierten Umweltmodellierung. Weiterhin werden in der ad- 
aptiven Umweltmodellierung neue Konzepte aufgrund von probabilistisch 
repräsentierten Objektbeobachtungen gelernt. Hier werden Methoden zur 
Fusion und Vereinfachung von Wahrscheinlichkeitsverteilungen benötigt, 
welche die beobachteten Eigenschaften der Objekte unsicherheitsbehaftet 
repräsentieren. Relevante Methoden der probabilistischen Informationsver- 
arbeitung werden in den nachfolgenden inhaltlichen Kapiteln jeweils direkt 
an den Stellen genannt, wo entsprechende Verfahren eingesetzt werden. 


Maschinelles Sehen Das maschinelle Sehen stellt auf gewisse Weise ein 
verwandtes Themengebiet dar, welches in Teilen mit Aspekten der objekt- 
orientierten Umweltmodellierung konkurriert. Dies betrifft z. B. alternative 
Vorgehensweisen zur Identifizierung und Klassifikation beobachteter Ob- 
jekte. Weiterhin stellt das Themengebiet ein methodisches Bindeglied zu 
bestimmten Anwendungsbereichen der objektorientierten Umweltmodellie- 
rung dar, wie z.B. zur Servicerobotik. Maschinelles Sehen beschäftigt sich 
u.a. mit der Erkennung von Objekten und Szenen in Bildern und Videose- 
quenzen. Verfahren des maschinellen Sehens definieren den aktuellen Stand 
der Wissenschaft und Technik für Aufgaben der Objekterkennung. Somit 
sind sie auch für die sensorische Umgebungswahrnehmung innerhalb der 
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Umweltmodellierung relevant. Weiterhin verwenden einige moderne Ansät- 
ze des maschinellen Sehens auch eine attributbasierte Darstellung für beob- 
achtete Objekte, welche für die Darstellung wahrgenommener Informatio- 
nen im objektorientierten Umweltmodell interessant ist. Dies ist allerdings 
die Ausnahme, die meisten z. B. merkmalsbasierten Objektdarstellungen er- 
füllen nicht die Anforderung in der Umweltmodellierung nach einer Darstel- 
lung mittels semantisch interpretierbarer Objekteigenschaften. Auch weite- 
re Aspekte der Umweltmodellierung, wie beispielsweise die Repräsentation 
von Objektzuständen oder eine Modellierung von Hintergrundwissen, ste- 
hen im Bereich des maschinellen Sehens nicht im Vordergrund. Auf relevan- 
te Teilaspekte des maschinellen Sehens wird in Abschnitt 2.5 eingegangen. 


2.2 Wissensrepräsentation für kognitive 
Systeme 


In diesem Abschnitt wird das Themengebiet der Wissensrepräsentation für 
kognitive Systeme dargestellt und der relevante Stand der Technik und 
Wissenschaft herausgearbeitet. Dies beinhaltet auch die Betrachtung von 
logisch-probabilistischen Modellen. 


2.2.1 Ihematischer Rahmen bezüglich der 
objektorientierten Umweltmodellierung 


Bevor in den nächsten Abschnitten auf den relevanten Stand der Technik 
und Wissenschaft zur Wissensrepräsentation eingegangen wird, soll zu- 
nächst der thematische Rahmen, in welchem repräsentiertes Wissen in der 
objektorientierten Umweltmodellierung relevant ist, aufgezeigt werden. 


Im objektorientierten Umweltmodell soll Vorwissen über eine Anwendungs- 
domäne repräsentiert werden. Dieses Vorwissen soll die für eine Anwen- 
dungsdomäne relevanten Objekte mittels ihrer relevanten Eigenschaften be- 
schreiben. Interessierende Eigenschaften betreffen dabei z.B. die Erschei- 
nung der Objekte, ihre physikalischen Eigenschaften oder ihren aktuellen 
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Zustand sowie ihre Beziehungen zu anderen Objekten. Weiterhin soll auch 
die Bedeutung der Objekte in der Anwendungsdomäne bzw. für die inten- 
dierte Anwendung des kognitiven Systems im Vorwissen repräsentiert wer- 
den, so dass ein kognitives System bei der Erfüllung seiner Aufgaben mög- 
lichst gut durch das Vorwissen unterstützt werden kann. 


Dieses Vorwissen soll dabei objektorientiert strukturiert sein - d.h. rele- 
vante Objekte werden abstrahiert durch Klassen beschrieben. Auch unsiche- 
res Wissen soll, in Form von Wahrscheinlichkeitsverteilungen, beschrieben 
werden können. Weiterhin muss eine semantische Beschreibung der Ob- 
jekte ermöglicht werden. Neben Vorwissen müssen im objektorientierten 
Umweltmodell auch aktuelle Informationen über Objekte (z.B. ihren Zu- 
stand betreffend) dargestellt werden. Sofern diese Informationen aus Be- 
obachtungen stammen (was im Allgemeinen angenommen wird), müssen 
diese ebenfalls als unsicherheitsbehaftet repräsentiert werden. Das objekt- 
orientierte Umweltmodell muss daher in der Lage sein, Zustandsinforma- 
tionen probabilistisch darzustellen. Dieser Aspekt muss bei der Wahl eines 
Formalismus zur Wissensrepräsentation für die objektorientierte Umwelt- 
modellierung entsprechend berücksichtigt werden. Der zur Repräsentation 
von Wissen verwendete Formalismus hat weiterhin Einfluss auf das Lernen 
neuer Konzepte, da diese ja innerhalb des Formalismus als Klassen mit ent- 
sprechenden Eigenschaften und Beziehungen repräsentiert werden müssen. 
Innerhalb dieses thematischen Rahmens sind daher folgende Bereiche der 
Wissens- und Informationsrepräsentation für diese Arbeit relevant: 


+ allgemeine Wissensrepräsentation, z.B. auf konzeptueller Ebene und 
mittels relationaler Strukturen und Logiken, 
« semantische Wissensrepräsentation und Ontologien, 


« probabilistische Informationsrepräsentation, z.B. anhand von Zu- 
standsraummodellen und 


« kombinierte Formalismen zur logisch-probabilistischen Darstellung 
von Wissen. 


Relationale Formalismen eignen sich besonders, um die grundsätzliche 
Struktur einer Anwendungsdomäne repräsentieren zu können - im Sinne 
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von Klassen relevanter Objekte und deren Eigenschaften, taxonomischer 
Beziehungen zwischen diesen Klassen etc. Vorwissen auch über komplexe 
Domänen kann hierbei strukturiert, handhabbar und wiederverwendbar 
dargestellt werden [Kol98, Las08, How09]. 


Probabilistische Informationen sind haufig Ergebnisse von Messungen oder 
Schätzungen und werden als Zufallsvariablen modelliert. Oft müssen die- 
se auch dynamisch aktualisiert werden, um z.B. schritthaltend den Zustand 
von veränderlichen Objekten darstellen zu können. Dabei müssen diskrete 
und stetige Zufallsvariablen dargestellt werden können. Gängige Verfahren 
(z. B. rekursive Bayes’sche Filterverfahren) verwenden zur Modellierung von 
Zufallsvariablen und ihrer probabilistischen Zusammenhänge oft Zustands- 
raummodelle. Zufallsvariablen werden hier zu Vektoren zusammengefasst 
und deren Wahrscheinlichkeitsverteilungen (approximativ) über parametri- 
sche Verteilungsannahmen repräsentiert. 


Die Wissensrepräsentation im objektorientierten Umweltmodell erfordert 
sowohl eine strukturierte Repräsentation der Anwendungsdomäne als auch 
die Darstellung von probabilistischen Informationen. Daher müssen kom- 
binierte Formalismen betrachten werden, welche auch eine probabilistische 
Repräsentation von Informationen ermöglichen. 


Zum Stand der Technik und Wissenschaft in diesem Bereich wird unter den 
genannten Aspekten in den nachfolgenden Abschnitten ein Überblick gege- 
ben, zugeschnitten auf den genannten thematischen Rahmen der objektori- 
entierten Umweltmodellierung. 


2.2.2 Relationale Wissensrepräsentation 


Eine grundlegende Form der Wissensrepräsentation orientiert sich an re- 
lationalen Strukturen. Verallgemeinert wird hier eine Anwendungsdomäne 
modelliert, indem die für die Domäne relevanten Entitäten (wie z. B. Objekte) 
samt deren Relationen untereinander erfasst sowie deren Attribute bestimmt 
werden. Ein abstraktes derartiges Modell wird auch als konzeptuelles Modell 
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der Anwendungsdomäne verstanden und kann mit entsprechenden Model- 
lierungssprachen repräsentiert werden. Eine stärker formalisierte Repräsen- 
tation solcher Modelle ist z.B. über die Prädikatenlogik möglich. Logikba- 
sierte Repräsentationen bieten i. A. den Vorteil, auch Mechanismen für das 
automatisierte Schlussfolgern bereitstellen zu können. Diese unterschiedli- 
chen Aspekte der relationalen Wissensrepräsentation werden nachfolgend 
kurz dargestellt. 


Konzeptuelle Modellierung 


Die konzeptuelle Modellierung einer Anwendungsdomäne ist ein wichtiger 
Aspekt und Prozessschritt im Bereich der Softwareentwicklung. Die kon- 
zeptuelle Modellierung hat zum Ziel, die wichtigsten Begriffe und Objekte 
einer Domäne zu erfassen und ihre Beziehungen untereinander zu beschrei- 
ben. Der Zweck dieser Modellierung ist dabei, die sich anschließenden Pha- 
sen des Softwareentwicklungsprozesses durch ein gemeinsames Verständnis 
der Domäne zu unterstützen, z.B. in Form von vereinheitlichten Begriffen 
sowie einer Strukturierung der Domänen-Entitäten [Rob15]. 


Als grundlegendes Modell und allgemeine Modellierungssprache kann in 
diesem Bereich das Entity-Relationship (ER) Modell nach Chen [Che76] ge- 
nutzt werden [Str13a]. Im ER-Modell werden Entitäten, d. h. identifizierbare 
Objekte der Anwendungsdomäne, sowie Beziehungen zwischen diesen mo- 
delliert. Gleichartige Entitäten werden zu Entitätstypen zusammengefasst, 
gleichartige Relationen zu Relationstypen. Entitäts- und Relationstypen 
werden über Attribute mit definierten Wertebereichen beschrieben. Re- 
lationen bzw. Relationstypen sind dabei nicht auf binäre Beziehungen 
beschränkt, d.h. es können Beziehungen zwischen mehr als zwei Entitäts- 
typen bestehen. Weiterhin können Kardinalitäten für Relationen spezifiziert 
werden [Carll], welche angeben, wie viele konkrete Entitäten eines 
Typs an einer Relation teilnehmen dürfen. Erweiterungen des ER-Modells 
führen weitere Modellelemente ein (d.h. Modellierungsprimitive, die ei- 
ne definierte Semantik innerhalb der Sprach von ER-Modelle besitzen): 
spezifische Beziehungen zwischen Entitätstypen wie Generalisierungs- 
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bzw. Spezialisierungsbeziehungen (sog. „is-a“ Beziehungen) sowie Teil- 
Ganzes-Beziehungen (sog. „part-of“ Beziehungen). Die Definition eines 
Domänenmodells erfolgt meist visuell mittels Diagrammen als graphen- 
basierte Darstellung. Insgesamt definiert das ER-Modell somit bereits die 
grundlegenden Elemente zur Modellierung einer Anwendungsdomäne. 


Eine ebenfalls visuell orientierte Modellierungssprache, welche zur kon- 
zeptuellen Modellierung eingesetzt werden kann, ist die Unified Modelling 
Language (UML) [Rum04]. UML ist im Bereich der objektorientierten Ent- 
wicklung von Softwaresystemen etabliert und hier besonders für Entwurf 
und Modellierung eine der wichtigsten Sprachen. Sie stellt die Konsoli- 
dierung und Vereinheitlichung vorhergehender Ansätze im Bereich der 
objektorientierten Modellierung dar [Fet16]. Bezüglich einer konzeptu- 
ellen Modellierung unterstützt UML, ähnlich zum ER-Modell, ebenfalls 
u.a. Klassen mit Attributen, binäre Relationen (auch gerichtet), Kardinali- 
tätseinschränkungen für Relationen, eine Generalisierungshierarchie der 
modellierten Klassen sowie mit Aggregation und Komposition spezielle Re- 
lationen für Teil-Ganzes-Beziehungen. Über Erweiterungen wie der Object 
Constraint Language (OCL) können zusätzliche Einschränkungen bzw. Zu- 
sammenhänge für und zwischen modellierten Klassen spezifiziert werden, 
wie Einschränkungen des Wertebereichs von Attributen, z.B. Nichtnega- 
tivität für ein quantitatives Attribut, oder Ordnungsrelationen zwischen 
den Werten von Attributen. Neben der konzeptuellen Domänenmodel- 
lierung bietet die Sprache auch Modellierungselemente für dynamische 
Aspekte wie beispielsweise der Modellierung von Ablaufsequenzen von 
Operationen oder Benutzerinteraktionen. 


Das ER-Modell und UML sind wichtige Vertreter von konzeptuellen Mo- 
dellierungssprachen. Daneben existieren weitere Ansätze, auf die hier aber 
nicht weiter eingegangen wird. Insgesamt sind konzeptuelle Modelle oft- 
mals in visuell orientierten, semi-formalen Sprachen repräsentiert [Str13a], 
die eine objektorientierte Modellierung der Anwendungsdomäne unterstüt- 
zen. Allerdings sind z.B. ER-Modell und UML nicht für die dynamischen 
Aspekte der Weltmodellierung konzipiert, wie beispielsweise die schritthal- 
tende Verwaltung von Instanzen zu den modellierten Klassen in Form einer 
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Wissensbasis [Zed13]. Auch besitzt UML keine modelltheoretische formale 
Semantik [Car11] und unterstiitzt somit kein logisches Schlussfolgern. Die 
inhärente Repräsentation probabilistischer Attribute ist im ER-Modell und 
in UML ebenfalls nicht vorgesehen. 


Logikbasierte Modelle 


Wahrend die konzeptuelle Modellierung im Bereich der Softwareentwick- 
lung eine große Rolle spielt, stellt die logikbasierte Wissensrepräsentation 
z.B. einen zentralen Baustein im Bereich der künstlichen Intelligenz dar, wo 
automatisiertes Schlussfolgern ein wichtiger Faktor ist. Als wichtigster Ver- 
treter im Bereich der logikbasierten Modellierung ist die Prädikatenlogik zu 
nennen [Las08]. 


Die Prädikatenlogik stellt eine Erweiterung der Aussagenlogik dar, welche 
diese um eine innere Struktur ergänzt [Las08]. Diese Struktur ermöglicht 
u.a. eine auf gewisse Art objektorientierte Modellierung der Anwendungs- 
domäne. Die Aussagenlogik [G0000] ermöglicht es, Aussagen wie „Die Tas- 
se steht auf dem Tisch“ mittels binärer Variablen zu modellieren. Aussagen 
können wahr oder falsch sein, so dass jede binäre Variable den entspre- 
chenden Wahrheitswert annehmen kann. Einzelne Aussagen können über 
logische Operatoren (sog. Junktoren) zu komplexen logischen Aussagen ver- 
knüpft werden, welche als Formeln bezeichnet werden. Dabei können eben- 
falls einfache Regeln in Form von Formeln abgebildet werden. Somit las- 
sen sich allgemeine Gegebenheiten, im Sinne eines Vorwissens, über eine 
Anwendungsdomäne als eine Menge von Formeln modellieren. Dabei wird 
davon ausgegangen, dass die modellierten Aussagen die Domäne auf eine 
axiomatische Weise beschreiben. 


Sind konkrete Informationen über die Domäne verfügbar (z.B. auf Basis ak- 
tueller Beobachtungen), so kann anhand dieser Informationen den in den 
Formeln enthaltenen Variablen (zumindest teilweise) ein Wahrheitswert zu- 
gewiesen werden (als Variablenbelegung im Sinne einer aussagenlogischen 
Interpretation). Durch diese Zuweisung lassen sich konkrete Information 
der Anwendungsdomäne („Instanzwissen“) aussagenlogisch repräsentieren. 
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Auf dieser Basis ist nun einerseits zu prüfen, ob die konkreten Informatio- 
nen zum Vorwissen konsistent sind, d.h. ob die modellierten Formeln unter 
der induzierten Interpretation erfüllt sind (mit Wahrheitswert wahr). An- 
dererseits kann mittels logischen Schlussregeln per deduktiver Inferenz auf 
weitere geltende (wahre) Aussagen geschlussfolgert werden - und somit un- 
ter Verwendung von Vorwissen weitere Informationen gewonnen werden. 


Die Prädikatenlogik (erster Ordnung) erweitert die Aussagenlogik um syn- 
taktische Ausdrucksmächtigkeit und zusätzliche Prinzipien. Für die Model- 
lierung einer Anwendungsdomäne sind dabei u.a. von Interesse [G0000]: 


« Variable Aussagen: Aussagen erhalten eine innere Struktur, indem 
sie nun von Variablen abhängen können - diese Aussagen werden 
dann als Prädikate bezeichnet. 


— Beispiel: Die aussagenlogische Aussage „Die Tasse ist weiß“ 
kann nun allgemeiner unter Verwendung eines Prädikats W (x) 
mit der intendierten Bedeutung „x ist weiß“ beschrieben 
werden. 


e Variablen (wie in Prädikaten) beziehen sich auf Entitäten eines 
angenommenen Individuenbereichs, welcher die Menge aller im 
Modell betrachteten Entitäten beschreibt (unabhängig von deren 
Typ), beispielsweise „die Menge aller Gegenstände in einem Raum“. 


« Quantifizierung von Aussagen: für mittels Variablen beschriebene 
Aussagen kann nun spezifiziert werden, ob sie für alle Entitäten 
gelten müssen oder für mindestens eine (beliebige) Entität - zu 
diesem Zweck werden Existenz- und All-Quantoren definiert. 


- Beispiele: „Es gibt mindestens eine weiße Tasse im Schrank S“ 
oder „Alle Tassen in Schrank S sind weiß“. 


« Eigenschaften und Funktionen: über Funktionen können 
Eigenschaften (bzw. Werte dieser Eigenschaften) von Entitäten 
modelliert werden. Die Entitäten werden dabei (analog zum 
Vorgehen bei Prädikaten) als Variablen der Funktionen angegeben. 
Weiterhin lassen sich Entitäten über Funktionen auch durch ihre 
Beziehungen zu anderen Individuen beschreiben. 
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— Beispiel: „Ort von x“, „Durchmesser von x“, „Vater von x“. 


Die Prädikatenlogik (im Folgenden ist immer die Prädikatenlogik erster 
Ordnung gemeint) ermöglicht es, strukturierte Aussagen über eine Anwen- 
dungsdomäne in Form von Formeln zu machen. Eine (prädikatenlogische) 
Formel besteht dabei aus Prädikaten, welche über Junktoren der Aussa- 
genlogik verbunden sind. Die Variablen in Prädikaten können dabei über 
Quantoren gebunden werden. Neben Variablen können Prädikate auch auf 
Funktionen von Variablen (und, rekursiv, von Funktionen) definiert sein 
[Goo00]. Äquivalenzrelationen (z.B. Gleichheit) und Ordnungsrelationen 
können ebenfalls als Prädikate modelliert werden. 


Zur Modellierung des Vorwissens für eine Anwendungsdomäne kann nun 
analog zum Vorgehen bei der Aussagenlogik eine Menge von Formeln an- 
gegeben werden, welche die Domäne axiomatisch beschreibt. Dabei kön- 
nen mittels Prädikaten Aussagen über bestimmte Teilmengen von Entitäten 
(im Sinne von Typen) formuliert werden, ähnlich zu objektorientierten Klas- 
sen. Im Unterschied zu Ansätzen der konzeptuellen Modellierung verfügt die 
Prädikatenlogik aber nicht über explizite Relationen mit spezifischer Seman- 
tik wie beispielsweise hierarchische „is-a“ Beziehungen. Diese müssen somit 
für jede Domäne eigens modelliert werden. 


Die Prädikatenlogik besitzt mit der modelltheoretischen Semantik [Goo00] 
eine formale Semantik, welche ein erstelltes Domänenmodell, d.h. eine 
Formelmenge, mengenbasiert interpretiert. Jedem domänenspezifischen 
Sprachelement (Prädikate und Funktionen) wird dabei eine Bedeutung 
zugewiesen. Dazu muss zunächst ein konkreter Individuenbereich spezifi- 
ziert werden, das sog. Universum. Konstanten und freie Variablen müssen 
anschließend auf Entitäten aus diesem Universum abgebildet werden. Für 
Prädikate muss festgelegt werden, für welche Entitäten aus dem Universum 
sie den Wahrheitswert wahr annehmen und für welche den Wert falsch. 
Dies kann in Form von Teilmengen des Raums erfolgen, der sich als das 
kartesisches Produkt über den Variablen eines Prädikats ergibt (d.h. als 
eine mathematische Relation). Für Funktionen muss festgelegt werden, auf 
welche Weise sie zwischen den Entitäten des Universums abbilden. Diese 
Festlegungen insgesamt werden als eine Interpretation der Formelmenge 
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bezeichnet. Sind dabei unter einer Interpretation alle Formeln erfüllt, so 
handelt es sich bei dieser um ein sog. Modell für die Formelmenge. Die 
Interpretation mit ihrem Universum beschreibt in diesem Fall eine sog. 
mögliche Welt für die modellierte Formelmenge. 


Im Falle der Wissensmodellierung für eine Domäne mittels Prädikatenlogik 
wird meistens bereits während der Spezifikation der Formelmenge implizit 
von einem bestimmten Universum und einer intendierten Interpretation der 
Formelmenge ausgegangen. Trotzdem kann das erstellte Domänenmodell 
auch anders interpretiert werden, d.h. beispielsweise auf ein anderes Uni- 
versum abgebildet werden. Mit Hilfe von Konstanten (nullstelligen Funktio- 
nen) können in der Prädikatenlogik bereits Aussagen über bestimmte kon- 
krete Entitäten einer Anwendungsdomäne getroffen werden (eine entspre- 
chende Interpretation implizit vorausgesetzt), so dass nicht nur Vorwissen 
auf der Ebene von Klassen a priori modelliert werden kann, sondern auch 
Instanzwissen, d. h. Informationen über konkrete Entitäten der Domäne. Auf 
diese Weise kann in der Prädikatenlogik auch fortlaufend eine Wissensbasis 
repräsentiert werden. 


Gegenüber einer objektorientierten Modellierung mittels UML ist ein prä- 
dikatenlogisches Modell einer Domäne allerdings deutlich schwieriger 
handzuhaben (in Bezug auf Aspekte wie Erstellung, Wartung etc.), vor 
allem auch deswegen, weil die Prädikatenlogik nicht explizit für diesen 
Anwendungszweck entwickelt wurde [Isr83]. Eine Möglichkeit, intuitiver 
verwaltbare Domänenmodelle zu erstellen, liegt in der Verwendung von sog. 
frame-basierten Ansätzen zur Domänenmodellierung, welche nachfolgend 
beschrieben werden. 


Die formale Semantik ermöglicht der Prädikatenlogik die Verwendung 
von deduktiver Inferenz, um nur implizit in einer Formelmenge enthaltene 
Informationen explizit darstellen und nutzen zu können. Ebenso können 
hiermit Widersprüche im Domänenmodell aufgedeckt werden, z.B. wenn 
dieses durch eine nicht erfüllbare Menge von Formeln repräsentiert wird. 
Inferenz in Prädikatenlogik ist korrekt und vollständig (die Ergebnisse einer 
Inferenz übertragen sich somit auf die Interpretationen der Formelmenge), 
allerdings i. A. nicht entscheidbar (d.h. es kann nicht notwendigerweise in 
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endlicher Zeit festgestellt werden, ob sich eine gegebene Formel aus einer 
Formelmenge ableiten lasst) [Goo00]. Um sowohl Entscheidbarkeit als auch 
effektive Berechenbarkeit, im Sinne einer Beschränkung der Worst-Case- 
Komplexität bzw. erwarteten Laufzeit, erreichen zu können, lassen sich 
syntaktische Teilmengen der Prädikatenlogik bilden, welche die zulässigen 
Sprachkonstrukte zur Domänenmodellierung entsprechend einschränken. 
Nachfolgend wird auf Beschreibungslogiken, welche solche Teilmengen 
darstellen, genauer eingegangen. 


Frame-basierte Modellierung 


Historisch gab es im Bereich der künstlichen Intelligenz (KI) verschiedene 
Richtungen bzgl. der Fragestellung, auf welche Art und Weise Wissen für 
kognitive Systeme repräsentiert werden sollte. Dabei stand z. B. eine mathe- 
matisch formale Richtung, welche auf Logiken als Mittel der Repräsentation 
setzte, gegenüber einer weiteren Richtung, welche sich bzgl. der Wissens- 
repräsentation stark an der Vorstellung orientierte, wie menschliche Denk- 
prozesse ablaufen [Isr83]. Ein Vertreter dieser letzteren Richtung ist mit dem 
Konzept der sog. Frames gegeben. Frames in ihrer Grundform nach Minsky 
[Min74] ermöglichen es, Vorwissen über prototypische Situationen in einer 
Datenstruktur zu repräsentieren. Dieses Vorwissen soll den Kontext liefern, 
der einem kognitiven System den Umgang mit einer vorliegenden Situation 
ermöglicht. Dazu stellen Frames in sog. Slots vorbelegte Standardwerte für 
ihre Attribute bereit. Diese Slots können sowohl Daten als auch Verknüpfun- 
gen zu weiteren, untergeordneten Frames enthalten. Attributwerte in Slots 
können durch beobachtete Informationen ergänzt, konkretisiert oder über- 
schrieben werden. Über die Verknüpfungen kann zwischen Frames navigiert 
werden, um z. B. ähnliche oder spezifischere Situationen auffinden oder auch 
mögliche, auf die aktuelle Situation nachfolgende Situationen vorhersagen 
zu können. Frames ermöglichen es weiterhin auch anzugeben, unter wel- 
chen Bedingungen ein Frame überhaupt angewendet werden kann. Frames 
stellen eine Version von semantischen Netzen dar [Rus10]. 
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Zur konkreten Wissensreprasentation im Bereich der KI werden sog. frame- 
basierte Reprasentationssysteme eingesetzt. Diese setzen das von Minsky 
beschriebene Frame-Konzept in Form von Repräsentationssprachen um, 
welche eine konzeptuelle Modellierung ermöglichen. Im Bereich der KI sind 
dabei häufig umfangreiche, komplexe, aber strukturierte Anwendungsdo- 
mänen zu modellieren. Vor dem Aufkommen der Idee des Semantic Web 
stellten frame-basierte Repräsentationssysteme den Stand der Technik 
zur Wissensrepräsentation in der KI dar [Kol98]. Sie zeichnen sich durch 
ein strukturiertes Vorgehen und eine modulare Wissensorganisation aus 
[How09] und stellen somit z. B. intuitiver handhabbare Wissensmodelle dar 
als eine entsprechende prädikatenlogische Repräsentation. 


Frames werden dabei als eine Datenstruktur umgesetzt, welche alles relevan- 
te Wissen zu einem Kontext (einer Situation, einem Objekt etc.) zusammen- 
gefasst repräsentiert. Die Frames entsprechen somit instanziierbaren Klas- 
sen, welche hierarchisch angeordnet sein können. Die Eigenschaften eines 
Frames werden wie oben erwähnt über Slots beschrieben [How09]. Einfache 
Slots stellen Werte dar, während komplexe Slots auf andere Frame-Instanzen 
verweisen. Neben einer statischen Beschreibung des modellierten Kontexts 
ermöglichen Frames auch die Modellierung prozeduralen Wissens: mit Slots 
können sog. Trigger verbunden sein, die bei ihrer Auslösung eine definierte 
Prozedur abarbeiten. 


Frame-basierte Repräsentationssysteme stellen die intuitive Modellierung 
einer Anwendungsdomäne in den Vordergrund. Oft besitzen die entspre- 
chenden Sprachen keine inhärente formale Semantik. Zum Teil wurde die- 
ser Aspekt nachgelagert betrachtet, z.B. durch das Abbilden einer Sprache 
auf Teile der Prädikatenlogik. Eine solche Sprache lässt sich dann als ei- 
ne alternative Art und Weise betrachten, um eine Domäne mittels (Teilen 
der) Prädikatenlogik zu modellieren [Rus10]. Andererseits gab es auch An- 
sätze wie F-logic [Kif89], welche die Aspekte intuitiver Modellierung und 
formaler Semantik explizit verbinden. Dieses Vorgehen, eine intuitive kon- 
zeptuelle Modellierung mit formaler Semantik und Inferenzmöglichkeit zu 
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kombinieren, fand seine konsequente Fortsetzung schließlich in den auf Be- 
schreibungslogiken basierenden Modellierungssprachen des Semantic Web 
(vgl. Abschnitt 2.2.3). 


2.2.3 Semantische Wissensrepräsentation und 
Ontologien 


Die Darstellung der Bedeutung für Domänen-Entitäten ist ein wichtiger As- 
pekt der Weltmodellierung für kognitive Systeme. Daher wird nachfolgend 
kurz auf das Thema Semantik in der Wissensrepräsentation eingegangen. 
Ein wichtiges Werkzeug für semantische Modelle stellen dabei Ontologien 
dar. Auch auf diese wird in diesem Abschnitt detaillierter eingegangen, z.B. 
in Bezug auf ihre Erstellung. 


Semantik in der Wissensrepräsentation 


Der Begriff Semantik kann unterschiedlich verstanden werden, je nachdem, 
in welcher Wissensdisziplin er gebraucht wird [Kuw11]. Allgemein wird un- 
ter Semantik die Lehre der inhaltlichen Bedeutung von sprachlichen Zei- 
chen verstanden [Cla01, Dud96]. Im Bereich der Linguistik bezieht Semantik 
sich z.B. auf die Bedeutung von natürlichen Sprachen und deren Zeichen 
wie Wörter oder Sätze. Wird der Zeichenbegriff allgemeiner verstanden, 
so gehört er zum Bereich der Semiotik, der allgemeinen Lehre der Zeichen 
[Cha01]. Die Semiotik beschäftigt sich mit der Frage, wie Zeichen allgemein 
Bedeutung erhalten [Stu86]. 


Ein grundlegendes Konzept ist dabei die triadische Relation eines Zeichens 
nach Peirce [Pei58]: um sich auf ein Objekt der realen Welt zu beziehen, wird 
ein Zeichen verwendet. Dieses als Symbol bezeichnete Zeichen vermittelt 
bei einem Empfanger eine Idee, d.h. eine gewisse, nicht notwendigerwei- 
se korrekte oder präzise Vorstellung über das bezeichnete Objekt. Objekt, 
Symbol und Vorstellung stehen somit in einer trinären Beziehung zueinan- 
der (vgl. auch das sog. semiotische Dreieck). Wichtig ist dabei anzumerken, 
dass die durch ein Symbol vermittelte Vorstellung nicht notwendigerweise 
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das gemeinte Objekt betreffen muss. Nach Morris [Mor70] bezieht sich in der 
Semiotik der Begriff der Semantik nun auf die (binäre) Beziehung zwischen 
Symbol und Objekt innerhalb der triadischen Relation eines Zeichens. Dies 
kann für die Domänenmodellierung dabei so interpretiert werden, dass die 
Bedeutung von verwendeten Symbolen in einem Domänenmodell (z. B. Klas- 
sen) möglichst eindeutig das gemeinte (modellierte) Objekt beschreiben soll. 


In Informatik und Mathematik betrifft Semantik häufig die Bedeutung der 
Konstrukte einer formalen Sprache [Cla01], z.B. von Logiken oder Program- 
miersprachen. Wird diese Bedeutung dabei formal beschrieben (wiederum 
z.B. mittels Logik), so spricht man von formaler Semantik. Für Program- 
miersprachen steht die Bedeutung der informationsverarbeitenden Sprach- 
konstrukte im Vordergrund. Diese kann operational bestimmt sein, also z.B. 
durch einen Interpreter der betrachteten Sprache, oder auch axiomatisch 
festgelegt werden durch die Angabe von Vor- und Nachbedingungen für die 
Operationen der Sprache (z. B. mittels Prädikaten). Für die Domänenmodel- 
lierung kann die Angabe von Vor- und Nachbedingungen z. B. relevant sein, 
um die möglichen Aktionen eines kognitiven Systems in ihrer Bedeutung für 
die (Veränderung der) Umgebung semantisch modellieren zu können. Auch 
die Funktionen von Geräten, mit welchen ein kognitives System in Erfüllung 
seiner Aufgaben interagiert, können derart beschreiben werden. In Bezug 
auf die konzeptuelle Modellierung in der Informatik bedeutet die semioti- 
sche Interpretation von Semantik auch hier, dass die intendierte Bedeutung 
der modellierten Konzepte möglichst klar beschrieben sein soll. Dies kann 
einerseits durch eine natürlichsprachliche Annotation von Konzepten (En- 
titäten, Relationen etc.) erfolgen. Hierbei wird das durch das Konzept reprä- 
sentierte Objekt der realen Welt allerdings nur für Menschen beschrieben, 
jedoch nicht in interpretierbarer Form für eine Maschine. Andererseits kann 
die Bedeutung eines Konzepts durch seine Beziehungen zu anderen Konzep- 
ten spezifiziert werden. Semantik entsteht bei diesem Vorgehen durch die 
Vernetzung von Informationen - und kann in maschineninterpretierbarer 
Form repräsentiert werden. In diesem Sinne sind z. B. ER-Modelle semanti- 
sche Domanenmodelle. Die sich ergebenden Modelle stellen dabei seman- 
tische Netze dar. 
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Semantische Wissensmodelle 


Eine Basis für semantische Domänenmodelle können sog. kontrollierte 
Vokabulare sein. Diese Vokabulare stellen eine sorgfältig erstellte Liste von 
Begriffen dar, in welcher die Begriffe eindeutig definiert und bezeichnet 
werden [ANS10]. Alternative Bezeichnungen können dabei als Synonyme 
markiert werden. Homonyme (gleichlautende Bezeichnungen mit jedoch 
unterschiedlichen Bedeutungen) müssen dabei unterschieden werden. 
Kontrollierte Vokabulare können als Glossare, Taxonomie oder Thesauri 
ausgeprägt sein, mit Glossaren als einfachster Form. Taxonomien fügen 
gegenüber Glossaren zusätzlich hierarchische Eltern-Kind-Beziehungen 
(„is-a“-Beziehungen) zwischen den definierten Begriffen hinzu [ANS10]. 
Thesauri erlauben weiterhin die explizite Hinzunahme von Synonym- 
und Ähnlichkeitsrelationen oder ggf. weiterer, standardisierter Relationen 
[ANS10]. 


Ontologien 


Eine noch stärkere Vernetzung, und im obigen Sinne eine erhöhte Semantik 
für das repräsentierte Wissen, kann durch Ontologien als Modelle zur Wis- 
sensrepräsentation erreicht werden. Der Begriff Ontologie bezeichnet dabei 
einerseits eine Art von Domänenmodell, andererseits beschreibt er die einem 
solchen Modell zugrunde liegende philosophische Disziplin. Die formale On- 
tologie als philosophische Disziplin ist die Lehre des Seienden [V6109]. Sie 
versucht, das Seiende begrifflich zu bestimmen [Bro00] und mittels Katego- 
risierung eine Systematik der grundlegenden Typen von Entitäten und der 
Beziehungen zwischen diesen zu bestimmen [Brä03]. 


Demgegenüber steht die Ontologie als ein konkretes Wissensartefakt der 
Domänenmodellierung. Eine Ontologie stellt dabei nach Gruber [Gru93] die 
formale Repräsentation der Konzeptualisierung einer betrachteten Domäne 
dar, genauer gesagt deren explizite Spezifikation. Ontologien als Domänen- 
modelle sollen dabei maschineninterpretierbar sein und ein gemeinsames 
Verständnis der Domäne (von beteiligten Interessensgruppen) reflektieren 
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[V6l09]. Der Begriff der Ontologie wird im allgemeinem Sprachgebrauch al- 
lerdings nicht immer einheitlich verwendet, was die Formalität und Aus- 
drucksstärke der damit bezeichneten Domänenmodelle betrifft [V 6109]. 


Im Kern umfasst eine Ontologie als formales Wissensmodell eine Menge von 
Begriffen [Stu19b]. Diese stellen das Ergebnis einer Konzeptualisierung der 
betrachteten Domäne dar und werden als Konzepte modelliert. Die Konzepte 
werden hierbei mittels Attributen beschrieben und sind in einer Taxonomie 
über „is-a“-Beziehungen hierarchisch angeordnet. Weiterhin ist eine Menge 
von Relationen gegeben, die die weiteren Beziehungen zwischen den Kon- 
zepten (bzw. zwischen Instanzen dieser Konzepte) beschreiben. Auch diese 
können hierarchisch organisiert sein. Die Begriffe, die zur Bezeichnung der 
Konzepte und Relationen verwendet werden, sollten ein kontrolliertes Voka- 
bular darstellen und können z.B. in einem Glossar (oft auch als Lexikon be- 
zeichnet) beschrieben werden. Ausdrucksstarke Ontologien beinhalten dar- 
über hinaus formale Axiome. Diese Axiome beschreiben Einschränkungen 
an die definierten Konzepte und Relationen, z. B. notwendige Relationen für 
Konzepte, Kardinalitätseinschränkungen an Relationen, Wertebereiche oder 
sogar feste Werte für Attribute. Mit der Anzahl solcher Axiome steigt, be- 
trachtet im Sinne einer Vernetzung von Information, auch die in einer On- 
tologie repräsentierte Semantik. Weiterhin können Regeln, formal beschrie- 
ben, ein Teil der Ontologie sein und z.B. Herleitungswissen beschreiben. 
Neben Wissen über die relevanten Klassen von Entitäten einer Domäne und 
deren Relationen kann in einer Ontologie auch Vorwissen und aktuelle In- 
formationen über konkrete Entitäten repräsentiert werden, als Instanzen der 
modellierten Konzepte. Eine Ontologie stellt in diesem Fall eine Wissens- 
basis dar. 


Zur praktischen Darstellung eines Domänenmodells durch eine Ontologie 
ist es sinnvoll, die Ontologie modular in Schichten unterschiedlicher Abs- 
traktionsebenen aufzubauen [Gua98]. Dieses Vorgehen erhöht ebenfalls die 
Möglichkeit zur Wiederverwendung der erstellten Ontologien [Sch06]. In 
der Literatur werden unterschiedliche Ebenen genannt, darunter: 


« Top-Level Ontologien, welche sehr allgemeine Konzepte unabhängig 
von einer Domäne oder Anwendung beschreiben [Stu19b, Gua98], 


29 


2 Stand der Technik und Wissenschaft 


« Kern-Ontologien (bzw. generische Ontologien [Stu19b]), welche auf- 
bauend auf den Festlegungen einer Top-Level Ontologie domänen- 
übergreifend wiederverwendbare Konzepte definieren bzw. Konzepte 
der Top-Level Ontologie präzisieren - sie stellen ihrerseits die Grund- 
lage für domänenspezifische Ontologien dar [Sch06], 


« Domänen-Ontologien, welche domänenspezifische Konzepte be- 
schreiben, aufbauend auf Kern- oder Top-Level Ontologien [Gua98] 


sowie 


« Anwendungs-Ontologien, welche schließlich die spezifischen Kon- 
zepte für den Anwendungszweck des Wissensmodells enthalten. 


Ontologien dienen auch dazu, Interoperabilität zwischen Akteuren, seien 
dies Menschen oder Systeme, im Sinne eines gemeinsamen semantischen 
Verständnisses herzustellen. Neben einer Wiederverwendung modellierten 
Wissens in anderen Bereichen und Anwendungen ermöglicht es der schich- 
tenweise Aufbau einer Ontologie auch, die Wissensmodelle der tieferen 
Schichten nach gemeinsamen Prinzipien und Kriterien aufzubauen. Somit 
können auch die diese Wissensmodelle nutzenden Systeme interoperabler 
gestaltet werden. So beschreiben Top-Level Ontologien z.B. eine grund- 
legende Strukturierung von zu repräsentierendem Wissen in prinzipielle 
Kategorien (wie z.B. die Unterscheidung von Abstraktem gegenüber Kon- 
kretem oder von zeitlich Existierendem gegenüber räumlich Existierendem 
etc.). Dabei kann auch bereits ein grundlegender kognitiver Bias [Mas03] 
festgelegt werden, im Sinne einer bestimmten philosophischen Sichtweise 
oder Interpretation der (zu modellierenden) Welt. Dies kann beispielswei- 
se die Art und Weise der Modellierung von Zeit, die Modellierung von 
Modalität oder das Abstraktionsniveau, auf welchem die Welt betrachtet 
wird, betreffen. Durch Kern-Ontologien können weitere, spezifischere 
Annahmen über die Welt beschrieben werden, welche zwar nicht als prin- 
zipiell allgemeingültig gelten können, aber im Rahmen eines verfolgten 
Ansatzes für alle zu modellierenden Domänen gelten sollen, wie z.B. eine 
probabilistische Darstellung von Attributwerten. 
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Ontologien als formale Wissensmodelle ermöglichen es, ein konzeptuelles 
Modell einer Domäne zu repräsentieren. Weiterhin verfügen viele Model- 
lierungssprachen für Ontologien über eine formale Semantik und ermögli- 
chen mittels ihrer formalen Axiome und Regeln das Schlussfolgern durch 
deduktive Inferenz. Ontologien vereinigen somit die Vorteile unterschiedli- 
cher Vorgehen zur Domänenmodellierung in einem einheitlichen Ansatz. 


Beschreibungslogiken 


Wie die Konzeptualisierung einer Domäne konkret als Ontologie repräsen- 
tiert wird, hängt von der verwendeten Ontologiesprache ab. Auch die Mög- 
lichkeit zur Inferenz im Domänenmodell sowie deren Berechnungskomple- 
xität' werden von der Ontologiesprache bestimmt. Eine Ontologiesprache 
sollte dabei idealerweise ausdrucksmächtig genug sein, um die Eigenheiten 
einer Domäne möglichst spezifisch und formal repräsentieren zu können. 
Allerdings steigt i. A. mit der Ausdrucksmächtigkeit der Ontologiesprache 
auch die Berechnungskomplexität der Inferenz (bis hin zur Unentscheidbar- 
keit in der Prädikatenlogik). Für Anwendungen muss daher ein angemesse- 
ner Kompromiss gefunden werden. 


Eine relevante Art von formalen Ontologiesprachen stellen die sog. Be- 
schreibungslogiken dar. Die nachfolgende Darstellung von Beschreibungs- 
logiken basiert, wenn nicht anders angegeben, auf Informationen aus 
[Baa03]. Beschreibungslogiken sind eine Familie von Repräsentationsspra- 
chen, welche auf Teilmengen der Prädikatenlogik basieren [V6109]. Sie 
wurden entworfen, um die formale Beschreibung einer Domäne zu verein- 
fachen und stellen eine Weiterentwicklung von Frames und semantischen 
Netzen dar [Rus10], vor allem im Hinblick auf ihre formale Semantik. 


Als Familie von Repräsentationssprachen ermöglichen Beschreibungslogi- 
ken einen Kompromiss zwischen Ausdrucksmächtigkeit einer konkreten 


* Der Begriff Berechnungskomplexität bezieht sich auf die Komplexität eines Problem im Sinne 
der Komplexitätstheorie - und wird hier, zur besseren Unterscheidbarkeit, mit dem Bestim- 
mungswort „Berechnung“ verwendet. 
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Sprache und der Berechnungskomplexitat ihrer Inferenz'. Entscheidbarkeit 
wird hierbei als Anforderung an eine praxisrelevante Beschreibungssprache 
vorausgesetzt. Eine ausdrucksmächtigere Beschreibungssprache ermöglicht 
die detailliertere Modellierung einer Anwendungsdomäne und ermöglicht 
somit eine erhöhte Semantik der Modelle, geht aber i. A. zugleich mit einer 
gesteigerten Worst-Case-Berechnungskomplexität einher. 


Beschreibungslogiken ermöglichen ein Zuschneiden der Beschreibungs- 
sprache an die Anforderungen der Domäne und der intendierten Anwen- 
dung. Ausgehend von atomaren Konzepten definieren sie zu diesem Zweck 
sog. Konstruktoren, die es ermöglichen, atomare Konzepte zu komple- 
xen Konzepten zusammenzusetzen. Je nachdem, welche Konstruktoren in 
einer Beschreibungssprache zulässig sind, ergeben sich unterschiedlich 
ausdrucksmächtige Sprachen. Konzepte werden in Beschreibungslogiken 
dabei nach modelltheoretischer Semantik als Mengen von Individuen in- 
terpretiert. Die grundlegenden Konstruktoren beinhalten den Schnitt von 
Konzepten, ihre Vereinigung sowie die Negation (Komplement) eines (ato- 
maren oder komplexen) Konzepts. Weiterhin dienen auch Einschränkungen 
an die möglichen Relationen eines Konzepts als Konstruktoren. Hierbei 
kann u.a. eine Mindest- oder Höchstzahl von Relationen eines Typs ge- 
fordert werden oder auch festgelegt werden, dass alle von einem Konzept 
ausgehenden Relationen eines bestimmten Typs nur zu einem bestimmten 
anderen Konzept bestehen dürfen. 


Wird eine Beschreibungslogik zur Domänenmodellierung verwendet, so be- 
stimmt die Menge der durch den Anwender definierten atomaren und kom- 
plexen Konzepte die Terminologie, mittels derer die Gegebenheiten der An- 
wendungsdomäne repräsentiert werden können. Auf Basis dieser Konzep- 
te können, unter Verwendung weiterer Operatoren für Konzepte wie der 
Gleichheit und der Teilmengen-Beziehung, Formeln definiert werden. Diese 
Formeln können z.B. eine „is-a“-Hierarchie der Konzepte beschreiben so- 
wie benannte Konzepte definieren, wobei ein atomares Konzept (als Name) 


* Die wichtigsten Inferenzaufgaben betreffen hier die Erfüllbarkeit eines Modells sowie die 
Subsumtion, d.h. das Enthaltensein eines Konzepts in einem anderen [Don03]. 
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einer komplexen Konzeptbeschreibung gleichgesetzt wird. Die Menge die- 
ser axiomatischen Formeln wird als TBox bezeichnet und beschreibt formal 
das Vokabular der Anwendungsdomäne als ein konzeptuelles Modell. Wis- 
sen über konkrete Entitäten der Domäne wird in der sog. ABox in Form von 
Instanzen der Konzepte der TBox repräsentiert. TBox und ABox bilden zu- 
sammen eine Wissensbasis für die Anwendungsdomäne. 


Je nach zugelassenen Konzept-Konstruktoren kann die Berechungskomple- 
xität von Inferenzaufgaben in der sich ergebenden Beschreibungssprache in 
eine der Komplexitätsklassen von P bis NEXPTIME fallen [Don03]. Die Hin- 
zunahme von Axiomen in der TBox, vor allem von Teilmengen-Beziehung 
(„is-a“-Hierarchie), kann die Komplexität gegenüber der Inferenz auf einer 
reinen Menge von Konzepten deutlich erhöhen. Trotz einer grundsätzlich 
hohen Berechnungskomplexität ist die Inferenz in einer Beschreibungslogik 
trotzdem häufig praktisch nutzbar und nützlich. Dies liegt darin begründet, 
dass in der Praxis der mittlere Zeitaufwand für „vernünftig“ große Pro- 
blem häufig weit unter der theoretischen Berechnungskomplexität liegt 
[Don03]. Unterstützt wird dies durch die Tatsache, dass die Forschung an 
entsprechenden Inferenzalgorithmen lange Zeit darauf abzielte, für im- 
mer ausdrucksmächtigere Beschreibungslogiken Verfahren zu finden, die 
durch Optimierung in der Praxis in ihrer Laufzeit größtenteils beherrschbar 
bleiben [Baa05]. 


Web Ontology Language 


Mit der zunehmenden Verbreitung des Internets wurde auch das World Wi- 
de Web (WWW) immer mehr zu einer ubiquitär verfügbaren Quelle von In- 
formationen. Vor diesem Hintergrund wurde von Tim Berners-Lee die Idee 
eines Semantic Web [Ber01] als Erweiterung des WWW geäußert. Dabei 
soll das im WWW enthaltene Wissen strukturiert werden, indem die auf 
Webseiten dargestellten Informationen um eine Beschreibung ihrer Bedeu- 
tung ergänzt werden [Kuc04]. Ziel ist, diese Informationen auch für Maschi- 
nen durchsuchbar, lesbar und automatisiert verarbeitbar zu machen, so dass 
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komplexere Aufgabenstellungen z. B. von intelligenten Softwareagenten au- 
tonom bearbeitet werden können. Um dies zu erreichen, werden sowohl eine 
gemeinsame Begriffsbildung als auch Sprachen zur Auszeichnung der Be- 
deutung von Informationen benötigt [Stu19a]. Weiterhin müssen diese Aus- 
zeichnungen automatisiert verarbeitet und kombiniert werden können. 


Als Werkzeuge für diese Zwecke sind Ontologien und Beschreibungslogiken 
geeignet [Hor03]. Im Bereich des Semantic Web bauen Beschreibungsspra- 
chen hierarchisch auf anderen Technologien und Standards des WWW auf 
(sog. Semantic Web Stack). Zu diesen zählen URIs* zur eindeutigen Iden- 
tifizierung von Begriffen sowie XML? bzw. RDF’ als Auszeichnungsspra- 
chen zur Beschreibung von Beziehungen zwischen Begriffen (auf Basis sog. 
Subjekt-Prädikat-Objekt Tripel). Um auf dieser Basis die notwendige Aus- 
drucksmächtigkeit einer Beschreibungssprache für das Semantic Web zu er- 
reichen, wurde schließlich die Web Ontology Language OWL als formale 
Ontologiesprache entwickelt und vom W3C* als offizieller Standard etabliert 
[Hor03]. OWL setzt dabei auf Beschreibungslogiken auf. Durch die anhal- 
tende Bedeutung des WWW wurde die Forschung im Bereich des Seman- 
tic Web somit zugleich zu einem Treiber der Weiterentwicklung im Bereich 
von Beschreibungslogiken und Techniken zur effizienten Inferenz in diesen 
sowie von Werkzeugen zur Erstellung und Verwaltung komplexer ontologi- 
scher Domänenmodelle. 


OWL ist eine Weiterentwicklung aus Vorgängersprachen [W3C04]. Die Aus- 
drucksmächtigkeit der Sprachen sollte dabei die Bedeutung von Informatio- 
nen im Bereich des WWW repräsentieren können. In das Design der Spra- 
chen floss weiterhin auch der Anspruch ein, sowohl die üblichen Sprachele- 
mente von objektorientierten bzw. frame-basierten Sprachen bereitstellen 
zu können als auch mittels formaler Semantik automatisiertes Schlussfol- 
gern zu ermöglichen [Hor03]. Als Ergebnis dieser Bemühungen vereinigt 


* Uniform Resource Identifier, vgl. RFC 3986 (https://tools.ietf.org/html/rfc3986) 

? Extensible Markup Language, W3C Recommendation (https://www.w3.org/TR/xml/) 

* Resource Description Framework, W3C Recommendation 
(https://www.w3.org/TR/rdf11-concepts/) 

* WWW Consortium, das fiir das WWW zustandige Standardisierungsgremium 
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OWL nun viele der bereits genannten Aspekte, die fiir eine sowohl intuitive 
als auch formale Domänenmodellierung wichtig sind. OWL als konsolidier- 
ter, umfassender Ansatz stellt dabei den Stand der Technik der logikbasier- 
ten Domänenmodellierung dar [Stu19b]. 


Der Standard des W3C zur OWL ist bereits in zweiter Version verfügbar 
[W3C12]. OWL definiert darin eine Familie von Ontologiesprachen: OWL 
Full, OWL DL und OWL Lite für OWL 1, sowie OWL 2 Full/DL und OWL 2 
EL, OWL 2 QL und OWL 2 RL. Diese Sprachen stehen dabei teilweise in hier- 
archischer Enthaltenseins-Beziehungen zueinander, in dem Sinne, dass eine 
Sprache eine syntaktische Teilmenge einer anderen ist. Die Sprachen dieser 
Familie stellen jeweils einen Kompromiss zwischen Ausdrucksmächtigkeit 
und Berechnungskomplexität dar. Manche der Sprachen lassen sich als Be- 
schreibungslogiken interpretieren bzw. basieren auf solchen, z.B. OWL DL, 
OWL 2 DL (der Zusatz „DL“ steht für Description Logic) und OWL 2 EL (der 
Zusatz „EL“ bezieht sich auf die Beschreibungslogik EL++ [Baa05]). Inferenz 
in OWL 2 EL ist dabei sogar effektiv berechenbar' , d. h. in der Komplexitats- 
klasse P [W3C09]. Trotz Einschränkungen in ihrer Ausdrucksmächtigkeit ist 
diese Teilsprache wichtig für praktische Anwendungen, z. B. im Bereich der 
Medizin [Baa05]. OWL 2 DL basiert auf der Beschreibungslogik SROIQ(D), 
einer Erweiterung der Beschreibungslogik SHOIN(D), auf welcher OWL DL 
basiert [V6109, W3C12]. Die Benennung einer Beschreibungslogik erfolgt 
dabei nach einem Schema, in welchem jeder Buchstabe eine Menge erlaub- 
ter Konstruktoren bei der Definition von Konzepten repräsentiert [Baa03]. 
Die Beschreibungslogik SROIQ erlaubt somit u.a. folgende Konstruktoren: 


e Vereinigung, Schnitt und Komplementbildung für Konzepte, 


e Enumeration von Individuen, 
« Bedingungen an Beziehungen zu anderen Konzepten, auch gebunden 
an den Typ der Beziehung, wie 
— mindestens eine Beziehung eines Typs (auch zu einem vorgege- 
benen anderen Konzept), 


1 Übersetzung von „computationally tractable“ 
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— genaue Anzahl von Beziehungen eines Typs (auch zu einem vor- 
gegebenen anderen Konzept), 


— nur Beziehungen eines Typs zu einem vorgegebenen anderen 
Konzept 


e sowie eine Hierarchie von Beziehungen und die Definition von tran- 
sitiven, reflexiven oder inversen Beziehungen. 


Der Zusatz „(D)“ beschreibt dabei, dass die Verwendung konkreter Datenty- 
pen erlaubt ist. Beide OWL DL Beschreibungslogiken sind entscheidbar, die 
Worst-Case-Komplexität der Inferenz liegt allerdings in der Komplexitäts- 
klasse NEXPTIME (bzw. 2NEXPTIME) [W3C09]. Trotz dieser in der Theo- 
rie hohen Berechnungskomplexität kann in der Praxis oftmals eine akzep- 
table Laufzeit für Inferenzaufgaben erreicht werden, da Inferenzwerkzeu- 
ge (sog. Reasoner) entsprechend darauf optimiert sind [Baa05, Don03]. Für 
OWL 2 stehen weiterhin Werkzeuge zur Verfügung, mit deren Hilfe Ontolo- 
gien entwickelt, validiert und eingesetzt werden können. Für die graphische 
Entwicklung von Ontologien steht beispielsweise das Werkzeuge Protégé’ 
[Mus15] frei zur Verfügung, welches eine direkte Einbindung von Inferenz- 
werkzeugen wie Hermit [Gli10] und Pellet [Sir07] ermöglicht, für das Ziehen 
von Schlussfolgerungen sowie zur Konsistenzprüfung. 


Ausdrucksstärke und Bedeutung in formalen Modellen 


Trotz der Ausdrucksmächtigkeit formaler Ontologiesprachen muss man sich 
darüber im Klaren sein, dass das semantische Modell, das sich im Sinne ei- 
ner Bedeutung der modellierten Konzepte ergibt, für ein kognitives System 
rein aus der Vernetzung von symbolischen Bezeichnungen besteht. Die Vor- 
stellungen (im Sinne der triadischen Relation der Semiotik), die wir Men- 
schen zusätzlich mit diesen Bezeichnungen verbinden, erschließen sich dem 
kognitiven System nicht (vgl. z.B. [V6109]). Dazu wäre es notwendig, dass 
das kognitive System zumindest einer Teilmenge der symbolischen Bezeich- 
nungen eine dem Wissensmodell externe Bedeutung zuordnen kann - z.B. 


* Verfügbar unter: https://protege.stanford.edu/ 
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in Form von sensorischen Eindrücken oder Erfahrungswerten (vgl. das sog. 
Symbol Grounding Problem). Die Ausdrucksstärke eines ontologischen Mo- 
dells kann nach Völker [Vö109] formal darüber beschrieben werden, wie 
viele mögliche Welten ein Modell als logische Interpretationen durch seine 
Axiomatisierung ausschließt, bezogen auf die zu modellieren beabsichtig- 
ten Welten. Je mehr unbeabsichtigte Welten ausgeschlossen werden, desto 
ausdrucksstärker ist die erstellte Ontologie. 


Ontologie-Entwurf und Prinzipien der formalen Ontologie 


Ontologien als Wissensmodelle stellen Ingenieursartefakte dar. Um qualita- 
tiv hochwertige Ontologien entwerfen zu können, ist daher ein strukturier- 
tes Vorgehen erforderlich. Für den Ontologie-Entwurf finden sich in der Li- 
teratur zahlreiche Vorgehensmodelle und Empfehlungen, darunter die von 
Damm [Dam03] und Noy [Noy01]. Stollberg [Sto02] gibt weiterhin einen 
Überblick über einige dieser Vorgehensmodelle. Gemeinsam ist den Ansät- 
zen dabei eine Aufteilung in Phasen. An eine initiale Analyse- und Spezi- 
fikationsphase schließt sich eine Konzeptualisierungsphase an, gefolgt von 
einer Definitions- und Formalisierungsphase und schließlich abgeschlossen 
durch eine Evaluationsphase [Sto02, Dam03]. In der Analysephase werden 
u.a. Domäne, gewünschter Einsatzzweck und Nutzer der Ontologie ermit- 
telt und festgestellt. Weiterhin können sog. Kompetenzfragen [Grü95] spe- 
zifiziert werden. Dies sind Fragestellungen, auf welche das zu entwickeln- 
de Wissensmodell Antworten bereitstellen können soll. Kompetenzfragen 
begleiten den Entwicklungsprozess, z.B. zur Ableitung von Entwurfsent- 
scheidung. Sie dienen dabei auch zur Auswahl der zu repräsentierenden En- 
titäten und Beziehungen. Die Konzeptualisierung beschäftigt sich mit der 
Herausbildung der relevanten Konzepte für die zu modellierende Domäne. 
Dabei werden ausgehend von relevanten Begriffen der Domäne Klassen ge- 
bildet, diese taxonomisch angeordnet und mittels Attributen beschrieben. 
In der Definitionssphase wird die erstellte Konzeptualisierung formal reprä- 
sentiert. Dabei werden auch bereits existierende Ontologien eingebunden, 
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wie z.B. eine Top-Level Ontologie. In der Evaluationsphase wird die erstell- 
te Ontologie in Bezug auf Kriterien wie Vollstandigkeit und logische Konsis- 
tenz qualitätsgeprüft. Weiterhin wird geprüft, ob die Ontologie in der Lage 
ist, die spezifizierten Kompetenzfragen zu beantworten. Eine Qualitatssiche- 
rung kann insgesamt auch phasenübergreifend während des gesamten Ent- 
wicklungsprozesses erfolgen, ebenso wie die Dokumentation von Entwurfs- 
prinzipien und Umsetzungsentscheidungen. 


Qualitätskriterien Allgemeine Kriterien, die für eine Entwicklung von 
qualitativ hochwertigen Ontologien beachtet werden sollten, werden von 
Gruber [Gru95] genannt. Darunter sind: 


e Klarheit bezüglich der definierten Konzepte, indem diese so weit wie 
möglich durch Axiome formal beschrieben sowie natürlichsprachlich 
dokumentiert werden, 


e Kohärenz und Konsistenz, dies betrifft einerseits die Kohärenz zwi- 
schen formaler und natürlichsprachlicher Beschreibung, andererseits 
die Widerspruchsfreiheit der formalen Axiome, 


« Erweiterbarkeit, um eine Ontologie möglichst abwärtskompatibel er- 
weitern zu können, 


« minimale Abhängigkeiten von Repräsentations- und Implementie- 
rungsdetails, um eine Ontologie flexibel mittels unterschiedlicher 
Formalismen umsetzen und anwenden zu können, 


e minimale, nur notwendige ontologische Festlegungen, um innerhalb 
des von der Ontologie intendierten Rahmens möglichst viele Anwen- 
dungsfälle unterstützen zu können. 


OntoClean Ein konkretes Vorgehensmodell mit spezifischer Zielsetzung 
ist durch die OntoClean Methodik von Guarino und Welty [Gua02] gegeben. 
OntoClean setzt auf Prinzipien der formalen Ontologie (als philosophischer 
Disziplin) auf und legt seinen Schwerpunkt auf die diesbezüglich korrekte 
Erstellung taxonomischer „is-a“-Beziehungen. Hierfür werden die Konzepte 
einer Ontologie zunächst mit Meta-Eigenschaften annotiert, durch welche 
die Konzepte nach Aspekten der formalen Ontologie wie Essenz, Einheit 
oder Abhängigkeit charakterisiert werden. Auf Basis dieser Annotationen 
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definiert OntoClean Regeln, mit deren Hilfe unzulässige taxonomische Be- 
ziehungen in einer Ontologie identifiziert werden können, was zur Vermei- 
dung formaler Modellierungsfehler und deren Konsequenzen beiträgt. 


2.2.4 Repräsentation probabilistischer Informationen 


Bisher wurden Ansätze zur Repräsentation von sicherem Vorwissen betrach- 
tet. Die objektorientierte Weltmodellierung muss allerdings auch in der Lage 
sein, unsichere Informationen als Vorwissen in einem Wissensmodell dar- 
stellen zu können (vgl. 2.2.1). Unsicherheit in Wissen kann unterschiedliche 
Ursache haben, darunter die nur unvollständige Bekanntheit von Wissen 
oder die (in der Praxis) nur unvollständig mögliche Erfassung und Reprä- 
sentation bekannten Wissens [Rus10]. Auch im Bezug auf die Messung von 
Eigenschaften oder Größen relevanter Entitäten einer Domäne können die 
gewünschten Informationen unter Umständen nur ungenau erfasst oder nur 
indirekt beobachtet werden [Sch11]. 


Unsicherheit in Informationen und Wissen kann ihrer Art nach unterschied- 
lich behandelt werden. Bei der Domänenmodellierung kann es z. B. vorkom- 
men, dass sich manche Begriffe nur unscharf definieren lassen - beispiels- 
weise, weil bereits die natürlichsprachliche Bedeutung eines Begriffs nur va- 
ge angegeben werden kann. Soll ein solcher Begriff formal modelliert wer- 
den, z.B. als ein Prädikat der Prädikatenlogik oder ein Konzept der Beschrei- 
bungslogik, überträgt sich die Problematik: die Menge der enthaltenen Indi- 
viduen kann nicht scharf begrenzt werden. Unsicherheit in Form solch vager 
Beschreibungen kann über die unscharfen Mengen der Fuzzy Logik [Zad65] 
behandelt werden. Anstelle der binären Zugehörigkeit eines Individuums zu 
einer Menge erlauben diese eine graduelle Zugehörigkeit, ermöglicht durch 
die Verwendung einer sog. Zugehörigkeitsfunktion mit reellen Werten auf 
dem Intervall [0,1]. Die Fuzzy Logik beschreibt dann, wie aufbauend auf sol- 
chen unscharfen Beschreibungen Schlussfolgerungen gezogen werden kön- 
nen [Rus10]. 
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Eine weitere Facette von Unsicherheit wird durch Unwissen dargestellt. Eine 
explizite Unterscheidung von Unwissen über einen Sachverhalt und nur un- 
sicherer Information über diesen wird in der Evidenztheorie nach Dempster- 
Shafer betrachtet [Dem68, Sha76]. Dabei wird insbesondere ermöglicht, das 
Unwissen über einen Sachverhalt explizit zu quantifizieren. In der Wahr- 
scheinlichkeitstheorie wird, falls für das Gelten einer Aussage A eine Wahr- 
scheinlichkeit p(A) bekannt ist, implizit die Wahrscheinlichkeit 1 — p(A) 
für das Nichtgelten der Aussage angenommen. In der Dempster-Shafer Evi- 
denztheorie bestimmt dahingegen eine quantifizierte Evidenz k(A) für das 
Gelten einer Aussage nur den Glauben (im Sinne eines Grades des Dafürhal- 
tens) an das Gelten der Aussage. Ein irgendwie geartetes Dafürhalten über 
das Nichtgelten der Aussage wird hierdurch nicht impliziert. Der Glaube, 
dass die Aussage nicht gilt, bleibt also durch die Evidenz für das Gelten der 
Aussage unverändert - genauer gesagt sogar solange gleich 0, bis eine ex- 
plizite Evidenz für das Nichtgelten vorliegt. Wenn eine solche Evidenz tat- 
sächlich vorliegt, mit Konfidenz k(A), so wird die Plausibilität des Geltens 
von A explizit reduziert, und zwar auf den Wert 1—k(A). Der Glaube an das 
Gelten der Aussage A wird dann, entsprechend der explizit vorliegenden 
Evidenzen, tiber das Intervall [k(A), 1- k(A)] quantitativ beschrieben. In 
Bezug auf die Semantik impliziter und expliziter Feststellungen zu Sachver- 
halten ähnelt die Evidenztheorie in ihrem Ansatz somit dem Vorgehen der 
sog. Open-World-Semantik von Beschreibungslogiken. Hierbei wird ange- 
nommen, dass Aussagen, zu denen bisher keine Informationen in einer Wis- 
sensbasis vorliegen, als unbekannt gelten - und nicht automatisch als falsch 
gelten, wie dies unter der gegensätzlichen Closed-World-Semantik von z.B. 
Datenbanksystemen interpretiert werden würde [Baa03]. 


Einen systematischen Ansatz zur einheitlichen Behandlung unsicher Infor- 
mationen, mit weiter Verbreitung [Noa10] und langer wissenschaftlicher 
Tradition [Rus10], stellt schließlich die Wahrscheinlichkeitstheorie dar. In 
den bisherigen Arbeiten zum objektorientierten Weltmodell werden unsi- 
chere Informationen aus Beobachtungen ebenfalls auf Basis der Wahrschein- 
lichkeitstheorie behandelt [Hei10]. Unsichere Eigenschaften beobachteter 
Domänen-Entitäten werden dabei über Wahrscheinlichkeitsverteilung im 
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Sinne eines Grades des Dafürhaltens beschrieben. Eine derartige Repräsen- 
tation unsicheren Wissens ist somit auch eine wichtige Anforderung an die 
Wissensmodellierung im objektorientierten Weltmodell (vgl. 2.2.1). Im Fol- 
genden wird daher auf die probabilistische Repräsentation unsicherer Infor- 
mationen in der Wahrscheinlichkeitstheorie eingegangen. 


Probabilistische Repräsentation 


Im Vergleich zur formalen Darstellung im Bereich der Logik werden proba- 
bilistische Informationen traditionell informaler und nahe an der mathema- 
tischen Notation repräsentiert [Rus10]. Unsicherheit in Bezug auf einen ein- 
zelnen Aspekt (beispielsweise den Wert einer Eigenschaft einer Domänen- 
Entität) wird in probabilistischen Domänenmodellen oft als Zufallsvariable 
modelliert und über Wahrscheinlichkeitsverteilungen bzw. Dichtefunktio- 
nen dargestellt. Die Verteilungen diskreter Zufallsvariablen können dabei in 
tabellarischer Form repräsentiert werden. Die Dichtefunktionen stetiger Zu- 
fallsvariablen sind als reellwertige Funktionen i. A. schwieriger zu repräsen- 
tieren. Allerdings werden in der Praxis häufig parametrische Verteilungsan- 
nahmen für stetige Zufallsvariablen getroffen, die es ermöglichen Standard- 
familien von Wahrscheinlichkeitsverteilungen über eine endliche Anzahl an 
Parametern kompakt darzustellen. 


Neben der probabilistischen Modellierung einzelner Eigenschaften durch 
skalare Zufallsvariablen ist auch die Modellierung von probabilistischen 
Zusammenhängen zwischen Entitäten (bzw. Konzepten) von Bedeutung. 
Diese Zusammenhänge werden probabilistisch über die gemeinsame Wahr- 
scheinlichkeitsverteilung der beteiligten Zufallsvariablen modelliert. Es 
lassen sich verschiedene Arten von Zusammenhängen unterscheiden, dar- 
unter stationäre und dynamische Zusammenhänge. Stationäre (statische) 
Zusammenhänge können beispielsweise kausale Beziehungen (Ursache 
und Wirkung) zwischen Entitäten modellieren. Sie ermöglichen eine pro- 
babilistische Repräsentation von Zusammenhängen, die in Logik mittels 
Regeln dargestellt werden. Neben stationären Zusammenhängen sind auch 
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dynamische, zeitbezogene Zusammenhänge relevant. Sie stehen in enger 
Beziehung zur Repräsentation des Zustandes eines dynamischen Systems. 


Für die objektorientierte Weltmodellierung sind dynamische Zusammen- 
hänge beispielsweise von Interesse, wenn der Zustand der relevanten 
Umgebung eines kognitiven Systems schritthaltend modelliert werden 
soll. Die Wissensrepräsentation muss daher in der Lage sein, derartige 
Zusammenhänge im Vorwissen darstellen zu können. Zustände werden 
dabei oftmals als Zufallsvektoren modelliert, d.h. als mehrere, zu einem 
Vektor zusammengefasste Zufallsvariablen. Der dynamische Zusammen- 
hang besteht oft zwischen verschiedenen Ausprägungen des den Zustand 
beschreibenden Zufallsvektors zu unterschiedlichen (z.B. diskreten) Zeit- 
punkten. Der Zustand zum aktuellen Zeitpunkt kann probabilistisch von 
vorhergehenden Zuständen abhängen beziehungsweise, bei Systemen mit 
Markov-Eigenschaft, z. B. von seinem direkten Vorgängerzustand. 


Wenn probabilistische Zusammenhänge vorwiegend dazu genutzt werden, 
um von einer Zufallsvariablen (bzw. einer Menge) auf andere Zufallsvaria- 
blen zu schließen, sind neben der gemeinsamen Verteilung der Zufallsvaria- 
blen vor allem bedingte Verteilungen von Interesse. Zum Beispiel beschreibt 
die Verteilung eines Nachfolgezustandes bedingt auf den Vorgängerzustand 
die probabilistische Transition des Zustandes über einen Zeitschritt hinweg. 
Somit ist auch die Repräsentation bedingter Verteilungen von Interesse. Für 
diskrete Zufallsvektoren können bedingte Verteilungen in Form von Matri- 
zen repräsentiert werden [Sch11]. Für Vektoren stetiger Zufallsvariablen er- 
gibt sich die bedingte Verteilung als eine reellwertige Funktion mit den be- 
teiligten Zufallsvariablen als Variablen. Auch hier kann es möglich sein, pa- 
rametrierbare Klassen von Funktionen zu verwenden, z.B. lineare Normal- 
verteilungen (deren Mittelwert linear variiert) [Rus10]. Dies hängt allerdings 
von den Gegebenheiten des Anwendungsfalls ab. 


Stationäre Zusammenhänge, vor allem kausale Beziehungen, sind für die 
probabilistische Form der deduktiven Inferenz von Interesse. Gegenüber 
logischen Regeln ermöglichen sie auch unter unvollständigem Wissen (z.B. 
bezüglich der Prämissen einer Regel) das Ziehen von Schlussfolgerungen. 
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Kausale Zusammenhänge werden probabilistisch ebenfalls durch die ge- 
meinsame Wahrscheinlichkeitsverteilung der beteiligten Zufallsvariablen 
repräsentiert. Eine probabilistische Inferenz kann, in Form einer Anfrage, 
wiederum über eine bedingte Verteilung beschrieben werden: Gesucht wird 
die Verteilung der interessierenden Zufallsvariablen bedingt auf andere 
Zufallsvariablen, deren Werte gegeben sind und als Evidenzen dienen. 


In der probabilistischen Modellierung dient die gemeinsame Verteilung rele- 
vanter Zufallsvariablen als eine Art Wissensbasis [Rus10], die das vorhande- 
ne Wissen über die Zufallsvariablen und ihre Zusammenhänge repräsentiert. 
Eine derartige Repräsentation kann allerdings schnell sehr komplex wer- 
den, in zweierlei Hinsicht. Einerseits müssen die Zusammenhänge relevan- 
ter Zufallsvariablen für die betrachtete Domäne zunächst einmal ermittelt 
und anschließend in einer Wissensrepräsentation dargestellt werden. Für 
große Domänen kann dabei nicht nur der entsprechende Arbeitsaufwand 
problematisch sein, sondern bereits das bloße Ermitteln der benötigten In- 
formationen. Andererseits steigt der Berechnungsaufwand der Inferenz mit 
der Größe der Zusammenhänge, d.h. der Anzahl der beteiligten Zufallsva- 
riablen, exponentiell an [Rus10]. Eine Möglichkeit, dieser Komplexität zu- 
mindest teilweise Herr zu werden, besteht im Ausnutzen von Unabhängig- 
keitsannahmen für die beteiligten Zufallsvariablen. 


Probabilistisch graphische Modelle Ein solches Ausnutzen von Unab- 
hängigkeitsannahmen wird als Ansatz in probabilistischen graphischen Mo- 
dellen [Jor04] verfolgt, welche parametrierbare Wahrscheinlichkeitsvertei- 
lungen auf Basis von Graphen definieren. Bayes’sche Netze stellen dabei 
einen Spezialfall graphischer Modelle basierend auf gerichteten Graphen 
dar [Rus10]. Graphische Modelle ermöglichen es, stochastische Unabhän- 
gigkeit zwischen beteiligten Zufallsvariablen auszunutzen, um eine weni- 
ger komplexe Repräsentation der gemeinsamen Verteilung zu finden. Dies 
wird über eine Faktorisierung der gemeinsamen Verteilung erreicht, wobei 
diese in einzelne Verteilungen über unabhängigen Zufallsvariablen faktori- 
siert wird. Bayes’sche Netze ermöglichen eine derartige Faktorisierung so- 
gar unter Verwendung der weniger starken Annahme einer nur bedingten 
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Unabhängigkeit zwischen (Teilmengen von) Zufallsvariablen. Derartige Ge- 
gebenheiten sind in der Praxis wesentlich häufiger anzutreffen. Die Fakto- 
risierung ermöglicht weiterhin eine gesteigerte Effizienz der Inferenz, wo- 
durch das probabilistische Schlussfolgern auch in praktischen Anwendun- 
gen skalierbar wird [Rus10]. Aufgrund ihres systematischen Vorgehens bei 
der Definition von Wahrscheinlichkeitsverteilungen, vor allem in Bezug auf 
das Explizieren von Abhängigkeitsstrukturen, werden graphische Modelle 
als ein geeignetes Verfahren für eine allgemeine Bayes’sche Inferenz ange- 
sehen [Jor04]. 


Gegenüber den vorgestellten Ansätzen zur konzeptuellen bzw. semanti- 
schen Domänenmodellierung besitzen rein graphische Modelle allerdings 
einige Nachteile für ihre Anwendbarkeit in großen Domänen. So werden 
Bayes’sche Netze z.B. als nicht geeignet angesehen, um probabilistische Zu- 
sammenhänge in komplexen strukturierten Domänen effizient modellieren 
zu können [Kol98, How09]. Dies liegt darin begründet, dass die Domänen- 
modellierung mittels Bayes’schen Netzen auf der Ebene der Aussagenlogik 
stattfindet [Kol97, Mil06, Rus10]. Zufallsvariablen repräsentieren einzelne, 
nicht weiter strukturierte Aussagen. Die in einer Domäne vorhandene 
Struktur kann somit nicht für eine effizientere Modellierung ausgenutzt 
werden (z.B. durch Klassen zur Abstraktion sich wiederholender Anteile in 
der Domäne). Auch sind gewisse Annahmen in Bayes’schen Netzen nach 
ihrer Erstellung fest kodiert, wie beispielsweise die Anzahl betrachteter En- 
titäten [How09]. Die sich unter diesen Bedingungen für komplexe Domänen 
ergebenden Modelle sind in ihrer Erstellung, Wartung und Verständlich- 
keit nur schwer für Menschen handzuhaben. Zugleich sind diese Modelle 
auch bereits in Bezug auf ihren Berechnungsaufwand für Inferenzaufgaben 
praktisch oft nicht einsetzbar [How09]. 


Als Konsequenz aus dieser Erkenntnis wurden Modelle entwickelt, welche 
die Vorteile der Domänenmodellierung von konzeptuellen oder semanti- 
schen Modellierungssprachen mit der Fähigkeit graphischer Modelle zur 
Behandlung von Unsicherheit verbinden. 
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Kombinierte Ansätze 


Kombinierte logisch-probabilistische Ansätze zur Domänenmodellierung 
verbinden graphische Modelle mit Methoden der objektorientierten Model- 
lierung (Klassen, Vererbung etc.), der semantischen Modellierung (frame- 
basierte Systeme, OWL) oder direkt mit Prädikatenlogik. Diese Ansätze 
werden übergreifend unter der Bezeichnung „First-order Probabilistic Lan- 
guages“ (FOPL) zusammengefasst und zeichnen sich durch die Fähigkeit 
aus, auch komplexe probabilistische Zusammenhänge kompakt durch 
objektbezogene Abstraktionen repräsentieren zu können [Mil06]. 


Eine Übersicht über verschiedene FOPL und ihrer Eigenschaften wird von 
Milch und Russell [Mil06] gegeben. Die betrachteten FOPL werden nach be- 
stimmten Kriterien taxonomisch strukturiert. Wichtige Kriterien sind da- 
bei, für welche Aspekte der Domäne, auf welche Weise und wie weitgehend 
ein Ansatz ein Wahrscheinlichkeitsmodell der Domäne repräsentieren kann, 
und ob es möglich ist, das Wahrscheinlichkeitsmodell über einer unbekann- 
ten bzw. variablen Anzahl von Objekten aufzustellen. Als besonders relevant 
werden dabei Ansätze betrachtet, welche 


e Wahrscheinlichkeitsverteilungen über den möglichen Welten einer 
(logischen) Wissensbasis beschreiben, und zwar 


e strukturiert mittels Faktorisierung in bedingter Verteilung als lokale 
Modelle, und dabei 


e nicht von vornherein auf eine feste Anzahl von repräsentierten Enti- 
täten festlegen sind. 


Entsprechende Ansätze werden in dieser Arbeit ebenfalls als relevant zur 
Wissensrepräsentation für eine objektorientierte Weltmodellierung betrach- 
tet und nachfolgend näher beschrieben. 


Objektorientierte Ansätze Einen ersten Schritt in Richtung eines höhe- 
ren Abstraktionsgrades probabilistischer Modelle gehen Koller und Pfeffer 
in [Kol97] mit ihren objektorientierten Bayes’schen Netzen (OOBN). Diese 
ermöglichen es, sich wiederholende Strukturen einer Domäne effizient zu 
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repräsentieren, indem Entitäten zu Klassen zusammengefasst werden kön- 
nen und für diese Vererbung unterstützt wird. Die Klassen besitzen dabei 
Attribute, für welche lokale probabilistische Modelle definiert werden kön- 
nen. Mittels dieser sog. Fragmente Bayes’scher Netze werden probabilisti- 
sche Abhängigkeiten zu Attributen auch anderer Klassen repräsentiert. Auf 
Grundlage einer Wissensbasis, d.h. einer bekannten Anzahl von Instanzen 
pro Klasse, können die lokalen Modelle zu einem probabilistischen Gesamt- 
modell in Form einer gemeinsamen Wahrscheinlichkeitsverteilung der At- 
tribute aller Instanzen zusammengesetzt werden. 


Eine Erweiterung von OOBN sind die sog. probabilistisch-relationalen Mo- 
delle (PRM) [Kol98]. Diese erweitern die Fähigkeiten von OOBN beispiels- 
weise in Bezug auf die Repräsentation eines probabilistischen Modells mit ei- 
ner unsicheren Anzahl von Objekten und unsicheren Beziehungen zwischen 
diesen. Des Weiteren verbinden sie die probabilistische und semantische Mo- 
dellierung, indem ein framebasierter Ansatz zur Erstellung und Verwaltung 
der zugrundeliegenden Wissensbasis genutzt wird. Die verwendeten Frames 
werden dabei um die Möglichkeit erweitert, lokale probabilistische Modelle 
für die Attribute eines oder mehrerer in Beziehung stehender Frames darzu- 
stellen. Möglich ist dies auch für bereits existierende Domänenmodelle, so 
dass diese nachträglich um probabilistische Modellanteile erweitert werden 
können. Mit der Fähigkeit im probabilistischen Modell auch die Unsicherheit 
modellieren zu können, mit wie vielen anderen Instanzen eine Instanz der 
Wissensbasis in Beziehung steht (sog. Anzahlunsicherheit) und mit welchen 
Instanzen (Referenzunsicherheit), können PRM somit auch Unsicherheit in 
Bezug auf die relationale Struktur der Wissensbasis ausdrücken. 


Einen sehr ähnlichen Ansatz stellt die objektorientierte probabilistisch- 
relationale Modellierungssprache (OPRML) von Howard dar [How09]. Ein 
grundlegender Unterschied ist das Aufsetzen auf einer Variante von OOBN, 
durch welche z.B. die explizite Definition von Schnittstellen für die durch 
Frames modellierten Klassen ermöglicht wird. Dies erleichtert das Zusam- 
mensetzen der lokalen Modelle zu einem probabilistischen Gesamtmodell. 
Die Modellierungssprache unterscheidet weiterhin explizit den relationalen 
Anteil des Modells, welcher framebasiert eine Wissensbasis beschreibt, 


46 


2.2 Wissensreprasentation fiir kognitive Systeme 


und den probabilistischen Anteil, welcher die Abhängigkeiten zwischen 
Attributen der Frames modelliert. Zusätzlich zur Anzahl- und Referenzun- 
sicherheit in PRM können OPRML basierte probabilistische Modelle auch 
Existenzunsicherheit für Relationen berücksichtigen, indem die Existenz- 
wahrscheinlichkeit einer Relation explizit als Attribut repräsentiert wird. 


Prädikatenlogische Ansätze Einen noch ausdrucksmächtigeren FOPL 
Ansatz stellen die sog. Multi-Entity Bayesian Networks (MEBN) von Las- 
key [Las08] dar. Dieser erhöht die Ausdrucksmächtigkeit der Wissensba- 
sis auf endlich axiomatisierbare Formelmengen der Prädikatenlogik. MEBN 
können somit beliebigen prädikatenlogischen Ausdrücken Wahrscheinlich- 
keiten zuordnen. Ähnlich zu den bisher genannten objektorientierten An- 
sätzen werden auch in MEBN lokale probabilistische Modelle zur Faktori- 
sierung des Gesamtmodells genutzt. Allerdings muss eine Gruppierung von 
Zufallsvariablen hier nicht zwingend mit Objektbezug erfolgen, sondern es 
können allgemein inhaltlich zusammenhängende Aussagen gruppiert und 
über ein lokales probabilistisches Modell beschrieben werden. Eine solche 
Gruppe von Zufallsvariablen wird in einem sog. MEBN Fragment zusam- 
mengefasst, welches eine bedingte Wahrscheinlichkeitsverteilung definiert. 
Verschiedene solcher Fragmente können zu einer MEBN Theorie zusam- 
mengefasst werden. Die Zufallsvariablen eines MEBN Fragments stellen da- 
bei zugleich logische Ausdrücke dar. Diese Ausdrücke können freie (prädi- 
katenlogische) Variablen enthalten. Bei der Instanziierung des probabilisti- 
schen Gesamtmodells auf Basis der prädikatenlogischen Wissensbasis stel- 
len diese Variablen die Verbindung zwischen Individuen der Wissensbasis 
und MEBN Fragmenten dar. Durch diese Verbindung wird festgelegt, welche 
MEBN Fragmente wie oft instanziiert werden für das Gesamtmodell. Über 
sog. Kontextknoten in MEBN Fragmenten können dabei noch weitere Bedin- 
gungen an die Wissensbasis bzgl. ihrer Instanziierung formuliert werden. 


MEBN stellen dabei eine sehr allgemeine Modellierungssprache dar, aus wel- 
cher auch theoretische Erkenntnisse ableitbar sind. Sie beschränkt sich dabei 
nicht darauf, nur effizient berechenbare oder gar entscheidbare Modelle dar- 
stellen zu können. Für eine Anwendung ist daher ein Zuschneiden der Spra- 
che notwendig. Dieser Ansatz wird von Costa [Cos05] und Carvalho [Car11] 
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verfolgt, welche eine Implementierung von MEBN in OWL 2 DL vorstellen. 
Die als PR-OWL bezeichnete probabilistische Erweiterung von OWL model- 
liert dabei die MEBN Sprachkonstrukte in OWL. Die Ausdrucksmächtigkeit 
der Implementierung, und somit die probabilistisch darstellbaren Aussagen, 
werden somit auf die Beschreibungslogik SROIQ(D) reduziert. Dabei werden 
beispielsweise Konzepte fiir MEBN Fragmente und Theorien, aber auch fiir 
Wahrscheinlichkeitsverteilungen und Zufallsvariablen definiert. Somit wird 
eine Briicke zwischen OWL und MEBN Modellen geschaffen. Das Vorgehen 
ermöglicht es, existierende OWL Ontologien nachträglich um probabilisti- 
sche Anteile zu erweitern. Somit wird auch eine gewisse Aufteilung in rela- 
tionale und probabilistische Anteile des Domänenmodells erreicht. Aus einer 
beschreibungslogischen OWL Wissensbasis heraus kann dann, wie oben be- 
schrieben, ein probabilistisches Modell für die in MEBN Fragmenten model- 
lierten Zusammenhänge erzeugt werden. PR-OWL (2) wurde auch als Kan- 
didat für eine Repräsentation unsicherer Informationen im Semantic Web in 
Betracht gezogen. 


2.2.5 Zusammenfassung zur Wissensrepräsentation 


Im vorliegenden Abschnitt wurden unterschiedliche Ansätze zur Repräsen- 
tation von Domänenwissen vorgestellt und betrachtet. Ausgehend von den 
Anforderungen der objektorientierten Umweltmodellierung lag der Fokus 
dabei auf einem logikbasierten Formalismus, mit welchem semantische Wis- 
sensmodelle repräsentiert werden können. Für eine rein logische Formali- 
sierung ohne die Repräsentation von unsicherheitsbehafteten Informatio- 
nen ist dabei OWL 2 DL als Beschreibungslogik und Standard des Seman- 
tic Web der vielversprechendste Aufsatzpunkt. Zur strukturierten Reprä- 
sentation von unsicherheitsbehafteten Information in komplexen Domänen 
wurden weiterhin verschiedene kombiniert logisch-probabilistische Ansätze 
betrachtet. Diese setzen auf einem relationalen Modellanteil auf, z.B. dar- 
gestellt mittels einer Beschreibungslogik, und definieren über den Instan- 
zen der Wissensbasis zu diesem relationalen Modell dann eine gemeinsame 
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Wahrscheinlichkeitsverteilung von Instanzattributen. Der Fokus der proba- 
bilistischen Modellierung liegt hier auf der Ermöglichung von Inferenz, da- 
her werden i. A. nur nominale Merkmale als Attribute und diskrete Vertei- 
lungen betrachtet. 


2.3 Umweltmodellierung und 
Wissensmodelle 


Nach einer grundlegenden Darstellung der verschiedenen Herangehenswei- 
sen für eine Wissensmodellierung, z.B. im Bereich der KI allgemein, aber 
auch in der Softwareentwicklung, sollen in diesem Abschnitt konkrete, exis- 
tierende Wissensmodelle mit Bezug zur objektorientierten Umweltmodellie- 
rung betrachtet werden. Dies betrifft sowohl andere Umweltmodelle als auch 
allgemeine Wissensbasen im Bereich der KI. Weiterhin werden die Top-Level 
Ontologien betrachtet, die z.B. existierenden Wissensbasen zum Zweck ei- 
ner allgemeinen Strukturierung von Wissen zugrunde liegen. Schließlich 
werden auch einige spezialisierte Wissensmodelle mit Relevanz zur Umwelt- 
modellierung betrachtet, welche z.B. spezifisches Wissen zu Aspekten wie 
Zeit oder Maßeinheiten repräsentieren. 


2.3.1 Andere Umweltmodelle 


Zunächst soll auf verwandte Ansätze der Umweltmodellierung und deren 
Techniken und Verfahren zur Wissensmodellierung eingegangen werden, 
anhand von relevanten Beispielen. Die Umweltmodellierung im Sinne der 
Erstellung von Umgebungsmodellen wird in verschiedenen Forschungs- und 
Anwendungsbereichen betrachtet und eingesetzt, darunter die Bereiche der 
Unterstützung von Situationsbewusstsein, des autonomen Fahrens und der 
Servicerobotik. 
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Viele der zuvor genannten logisch-probabilistischen Repräsentationsspra- 
chen für Wissen entstammen dabei dem Bereich der Unterstützung von Si- 
tuationsbewusstsein. Das Ziel ist hier die Entwicklung kognitiver Assistenz- 
systeme, welche menschliches Situationsbewusstsein und Entscheidungs- 
findung durch die Darstellung von semantisch fundierten Lagebildern un- 
terstützen. Auch die Anwendung des objektorientierten Umweltmodells in 
intelligenten Videoüberwachungssystemen [Bau09], zur maritimen Situati- 
onsanalyse [Fis10, Kuw12b, Fis16], Informationsfusion [Kuw17] oder zum 
Schutz kritischer Infrastrukturen [Bou16, Kuw18] fällt in diesen Bereich. Zur 
Unterstützung von Situationsbewusstsein werden z.B. PRM in [Pfe99] oder 
OPRML in [How09] eingesetzt. Dabei wird zunächst ein relationales Wis- 
sensmodell definiert und dieses dann anhand von aktuellen Beobachtungen 
und Sensordaten als eine Wissensbasis zur Zustandsrepräsentation instanzi- 
iert [How10]. PR-OWL wird beispielsweise für die Klassifikation von Schif- 
fen in Assistenzsystemen eingesetzt [Las11]. 


Im Bereich des autonomen Fahrens wird eher von Umfeldmodellen ge- 
sprochen als von Weltmodellen. In solchen Umfeldmodellen werden die 
Informationen aus allen verfügbaren Sensoren eines Fahrzeugs zusam- 
mengefasst und integriert dargestellt. Ein wichtiger Teil der Modellierung 
ist dabei die Dynamik von Fahrsituationen, die häufig mittels Zustands- 
raummodellen sowie unterstützend kartenbasiert erfolgt. Eine explizite 
Modellierung von semantischem Wissen steht nur in einigen Fällen im 
Vordergrund. Dabei werden zum Teil nur einzelne Aspekte des autonomen 
Fahrens modellbasiert gelöst. Von Nienhüser [Nie14] werden z. B. bestimmte 
Fahrsituationen wie das Erkennen von Baustellen und relevanten Ampeln 
mittels Markov-Logik-Netzen und einem prädikatenlogischen Modell 
dieser Situationen gelöst. Es gibt weiterhin auch Ansätze, welche grundle- 
gend die Verwendung semantischen Wissens vorsehen. Schamm nutzt in 
[Sch14] zum Beispiel ein semantisches Wissensmodell zur Erkennung von 
Fahrsituationen. Zur Wissensrepräsentation wird dabei OPRML als logisch- 
probabilistische Repräsentationssprache eingesetzt. In dieser Sprache wird 
ein probabilistisch-relationales Modell von Fahrzeugen und Fahrsituationen 
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erstellt. Dieses Modell kann mittels aktueller Informationen aus dem Um- 
feldmodell zu einem Bayes’schen Netz instanziiert werden, welches dann 
zur Analyse von Fahrsituationen durch probabilistische Inferenz dient. 


Umweltmodelle im Bereich der Robotik 


Im Bereich der Robotik wird vornehmlich der Begriff der Weltmodellie- 
rung verwendet. Wissensmodelle werden dabei zur Unterstiitzung von 
Aufgaben wie der Planung, Navigation, Aktionserkennung und Mensch- 
Roboter-Interaktion eingesetzt [Tho18]. Ein Ansatz der Weltmodellierung 
zur Navigation und Missionsplanung sind sog. semantische Karten [Gal05, 
Uhl13]. Diese Karten stellen dabei hybride Umweltmodelle dar, welche eine 
räumliche Topologie der Umgebung erstellen und diese mit symbolischen 
Instanzen eines semantischen Modells verbinden, z. B. mittels Verankerung! 
[Gal05] der Symbole in Sensorbeobachtungen. Das Wissensmodell wird 
dabei als Vorwissen bereitgestellt und modelliert unterschiedliche Räume 
sowie diejenigen Objekte, die in diesen Räumen axiomatisch enthalten sein 
müssen oder nicht enthalten sein dürfen. Ebenfalls werden topologische 
Beziehungen zwischen Räumen modelliert. Die Modellierung erfolgt mittels 
Beschreibungslogik in [Gal05] bzw. F-logic in [Uhl13] ohne die Modellierung 
von unsicherem Wissen. Das Vorwissen kann genutzt werden, um Räume 
über die in ihnen enthaltenen, aus Sensorbeobachtungen bekannten Objek- 
te klassifizieren zu können [Gal05]. Ebenso kann für klassifizierte Räume 
abgeleitet werden, welche Objekte noch in ihnen erwartet werden können. 


Wissensbasen, welche im Bereich der Servicerobotik verfügbar sind, werden 
in [Tho18] im Überblick dargestellt. Als eine der einflussreichsten Wissens- 
basen wird dabei KnowRob von Tenorth und Beetz [Ten13, Ten09, Ten10] 
genannt. Mit KnowRob wird ein umfassender Ansatz zur wissensbasierten 


1 Verankerung (englisch „Anchoring“) bezeichnet nach Coradeschi [Cor03] den Prozess, eine 
Verbindung zwischen den Sensordaten und den Symbolen einer symbolischen Repräsentation 
herzustellen und aufrechtzuerhalten, welche sich auf dasselbe physische Objekt beziehen. 
Diese Problemstellung ist eng verwandt mit der Aufgabe der Datenassoziation im Bereich 
des Trackings und stellt einen Spezialfall des Symbol Grounding Problems dar. 
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Weltmodellierung verfolgt. Auch hier werden semantische Karten genutzt, 
welche mit einem Wissensmodell dynamisch verkniipft werden [Ten10]. Im 
Vordergrund steht bei diesem Ansatz allerdings die Wissensverarbeitung fiir 
autonome Roboter, mit einem Fokus auf der robusten Planung und Steue- 
rung von Handlungen in einer Haushaltsumgebung. Das entworfene System 
zur Wissensreprasentation und -verarbeitung ist dabei fiir eine echtzeitna- 
he Ausführung auf einem Roboter ausgelegt. 


Die Strukturierung des Wissensmodells in KnowRob ist inspiriert durch die 
Ontologie Cyc [Len95]. Für KnowRob wurde diese zugeschnitten und er- 
weitert, um spezifisch die Aktionen eines Haushaltsroboters und von diesen 
Aktionen betroffene Objekte darstellen zu können. Dabei werden in einer 
Top-Level Ontologie Kategorien wie Ereignisse, Aktionen, Agenten, Objek- 
te, Geräte und Orte als Konzepte modelliert. Diese Kategorien werden über 
Domänen-Konzepte spezialisiert, z.B. werden Aktion wie das Öffnen und 
Schließen von Behältnissen sowie das Aufnehmen und Ablegen von Objek- 
ten repräsentiert. Das Wissensmodell ist formal in OWL DL repräsentiert. 
Eine Axiomatisierung! besteht allerdings größtenteils nur in Bezug auf die 
modellierten Roboter-Aktionen, die von den Aktionen betroffenen Objekte 
sind nahezu rein taxonomisch und ohne Attribute beschrieben. 


Zur Verankerung dieses symbolisch beschriebenen Wissens in den Sensor- 
beobachtungen eines Roboters sind ebenfalls ansichtsbasierte, subsymboli- 
sche Objektmodelle in KnowRob hinterlegt. Diese können genutzt werden, 
um aus mittels Sensorik erworbenen Umgebungsinformationen eine ent- 
sprechende Wissensbasis zu instanziieren. In [Ten11] wird dabei ein Ansatz 
beschrieben, um derartige Objektmodelle semi-automatisiert unter Verwen- 
dung von Quellen im Internet in das Wissensmodell integrieren zu können. 
Dazu werden durch eine Suche entsprechende Objektbilder z. B. aus Online- 
shops bezogen und als Trainingsbeispiele für ein Klassifikationsmodell ge- 
nutzt. Über zusätzlich verfügbare Informationen wie Produktbeschreibun- 
gen werden diese Objektmodelle ins Wissensmodell eingeordnet. 


* In Bezug auf die auf der KnowRob Webseite (http://knowrob.org/kb/knowrob.owl, letzter Ab- 
ruf: 26.02.2020) verfügbare Ontologie. 
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Mittels Verfahren der Sprachverarbeitung kann das Wissensmodell wei- 
terhin auch mit Handlungswissen gefüllt werden, welches die Ausführung 
von Alltagsaufgaben beschreibt. Dieses wird ebenfalls semi-automatisch 
aus Quellen im Internet erworben und in eine beschreibungslogische Form 
überführt [Kun10, Ten11]. Für die beiden semi-automatischen Vorgänge 
zum Erwerb von Wissen aus dem Internet ist ein menschliches Eingreifen 
z.B. zur Qualitätssicherung des Wissens oder zur Disambiguierung von Be- 
griffen notwendig. Die Techniken werden daher eher als eine Unterstützung 
für den Menschen bei der Wissensmodellierung angesehen [Ten13]. 


Die Wissensrepräsentation in KnowRob erfolgt zunächst prinzipiell deter- 
ministisch. Mittels Bayesian Logic Networks [Jail1] ist allerdings ebenfalls 
eine Komponente zur Darstellung von probabilistischen Zusammenhängen 
und zur probabilistischen Inferenz in das System integriert. Für spezifische 
Teilaspekte kann somit eine Modellierung von Unsicherheiten erfolgen. Dies 
betrifft hauptsächlich Beziehungswissen und kann nur mittels diskreter Zu- 
fallsvariablen erfolgen. Die Instanziierung probabilistischer Teilmodelle er- 
folgt dabei bei Bedarf und aus der Wissensbasis heraus. 


Neben KnowRob gibt es noch weitere Wissensbasen im Bereich der Ser- 
vicerobotik. Zwei wichtige Beispiele sind das Ontology-based Unified Ro- 
bot Knowledge (OUR-K) [Lim11] sowie die Open Robots Ontology [Lem11]. 
OUR-K von Lim et al. stellt dabei ebenfalls einen umfassenden Ansatz zur 
Weltmodellierung dar, welcher Aspekte der Welt auf unterschiedlichen Ebe- 
nen zusammenhängend repräsentiert. Dabei werden Merkmale von Objek- 
ten modelliert, Objekte selbst, Karten auf metrischer, topologischer und se- 
mantischer Ebene, räumliche und zeitliche Beziehungen von Objekten sowie 
Aufgaben und Handlungen eines Roboters. Das Modell ist dazu in fünf un- 
terschiedliche Kategorien eingeteilt (wie Objekte), welche jeweils bis zu drei 
Ebenen besitzen (wie Objektteile, Objekte und Objektgruppen). Innerhalb 
dieser Struktur werden dann konkrete Konzepte modelliert (wie Tassen als 
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Objekte). Zwischen den Kategorien und Ebenen können Beziehungen unter- 
schiedlicher Art bestehen, z. B. Teile-Ganzes-Beziehungen zwischen Objekt- 
teilen und den entsprechenden Objekten oder eine Zuordnung von Merkma- 
len zu Objektteilen. Merkmale sind auf symbolischer Ebene und auf subsym- 
bolischer Ebene repräsentiert, wobei letztere in Sensordaten verankert’ sind. 
Neue Sensorbeobachtungen können somit Aktualisierungen in der Wissens- 
basis bewirken, d.h. die Erzeugung neuer Konzeptinstanzen oder die Ak- 
tualisierung existierender Instanzen. Als Repräsentationssprache wird dabei 
OWLDL verwendet. Zusätzlich werden prädikatenlogische Regeln definiert. 
Diese dienen der sog. Wissensassoziation, mit welcher zur Laufzeit unter- 
schiedliche Fakten (Instanzen der Wissensbasis) miteinander verknüpft wer- 
den, um einen Roboter bei der Ausführung seiner Aufgaben zu unterstützen. 


Lemaignan [Lem12] beschäftigt sich zunächst grundlegend mit dem Thema 
der Wissensrepräsentation für Serviceroboter. Dabei werden unterschied- 
liche existierende Ansätze, darunter KnowRob und OUR-K, betrachtet und 
analysiert. Alle betrachteten Ansätze werden anhand eines in [Lem11] ent- 
wickelten Klassifizierungsschemas für Wissensrepräsentationssysteme ein- 
geordnet. Darauf aufbauend wird von Lemaignan die Open Robots Ontology 
(ORO, [Lem11, Lem12]) definiert. ORO stellt eine OWL 2 DL Wissensbasis 
für Serviceroboter dar, welche die aktive Verwaltung und Abfrage des ent- 
haltenen Wissens unterstützt. Zur Darstellung von Vorwissen enthält ORO 
ein Wissensmodell mit Alltagswissen im Umfang von 56 Klassen und 60 
Relationen. Als Top-Level Ontologie wird OpenCyc eingesetzt. ORO unter- 
stützt im Speziellen die dialogbasierte Interaktion mit einem Serviceroboter. 
Dabei ist es z. B. möglich, dem Roboter unbekannte Objekte von einem Men- 
schen solange beschreiben zu lassen, bis diese innerhalb der Wissenstaxo- 
nomie von ORO ihrem Typ nach eingeordnet werden können [Lem12]. Auf 
diese Weise können auch Begriffe der menschlichen Sprache in den Beob- 
achtungen bzw. im Wissen des Roboters verankert” werden. 


* im Sinne von Symbol Grounding 


2? im Sinne von Symbol Grounding 
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2.3.2 Existierende Wissensbasen und -modelle 


Weiterhin relevant für die Wissensrepräsentation in Umweltmodellen sind 
auch Arbeiten, die explizit dem Aufbau von komplexen Wissensbasen die- 
nen, welche z.B. Allgemein- und Alltagswissen repräsentieren. Derartige 
Wissensbasen dienen oft der Erforschung und Entwicklung neuartiger in- 
formationsverarbeitender Systeme und werden z.B. eingesetzt, um das Ver- 
stehen natürlicher Sprache, die gezielte Suche nach Informationen oder das 
Ziehen von Schlussfolgerungen in Alltagssituationen zu unterstützen. Ein 
Beispiel für solch eine Wissensbasis ist die Ontologie Cyc[Len95], welche 
im gleichnamigen Projekt seit Langem entwickelt wird. Weitere Beispiele 
solcher Wissensbasen sind WordNet [Mil95], ConceptNet [Liu04] oder Pro- 
jekte wie DBPedia [Leh15] und YAGO [Reb16], welche menschliches Allge- 
meinwissen erfassen und auf formalisierte Weise im Internet frei verfügbar 
machen. Diese Wissenbasen stellen dabei sog. Wissensgraphen bzw. Linked 
(Open) Data dar, d.h. umfangreiche semantische Netze. 


Für die Umweltmodellierung ist vor allem die Frage interessant, inwieweit 
das in solchen Wissensbasen repräsentierte Wissen in einem Hintergrund- 
wissensmodell genutzt werden kann. Hier spielen Aspekte wie die Darstel- 
lungsform und Formalisierung des Wissens, der kognitive Bias der Modellie- 
rung sowie die Qualitätssicherung erstellter Modelle eine Rolle. Weiterhin ist 
die grundlegende kategorische Strukturierung des repräsentierten Wissens 
von Bedeutung. Zu diesem Zweck wird nachfolgend eine Auswahl relevan- 
ter Wissensbasen und Strukturierungsansätze näher betrachtet. 


WordNet [Mil95] ist eine frei verfügbare lexikalische Datenbank, welche 
Begriffe bzw. Gruppen bedeutungsgleicher Begriffe als Konzepte eines taxo- 
nomischen Wissensmodells beschreibt und mittels semantischer Relationen 
in Beziehung setzt. Neben Synonymen werden Ober- und Unterbegriffe 
(Hyper- und Hyponyme), Teile-Ganzes-Beziehungen (Meronyme und Ho- 
lonyme) sowie Gegensätze (Antonyme) im Wissensmodell repräsentiert. 
Weiterhin werden Homonyme (gleichlautende Begriffe mit unterschied- 
licher Bedeutung) durch die genannte Gruppierung bedeutungsgleicher 
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Begriffe unterschieden. Die Strukturierung von Wissen in WordNet orien- 
tiert sich im Wesentlichen an diesen semantischen Relationen. WordNet 
wird haufig im Bereich der Verarbeitung natiirlicher Sprache eingesetzt, 
insbesondere zur Disambiguierung von Begriffen. 


Eine ähnlich aufgebaute Wissensbasis stellt ConceptNet [Liu04] dar, welches 
aus dem Open Mind Common Sense Projekt hervorgegangen ist. Ziel dieses 
Projekts war es, eine möglichst große Menge an Allgemeinwissen in einem 
web-basierten Crowdsourcing Ansatz zu erfassen. Das erfasste Wissen wird 
in Form von einfach gehaltenen, natürlichsprachlichen Sätzen dargestellt. 
Für ConceptNet werden diese Sätze automatisch aufbereitet und als ein se- 
mantisches Netz formalisiert dargestellt. Die erzeugten Konzepte orientieren 
sich dabei an zusammengesetzten Ausdrücken und können z.B. Nominal- 
phrase, Verbalphrasen oder Attributphrase repräsentieren. Im Gegensatz zu 
WordNet werden neben semantischen Relationen noch über 20 weitere Ty- 
pen von Relationen in ConceptNet unterstützt. ConceptNet ist frei verfügbar 
und stellt eine Form von Linked Open Data dar. 


Der Begriff Linked Data nach Berners-Lee [Ber06], bzw. Linked Open Data, 
falls frei verfügbar, beschreibt in seiner Reinform untereinander in Bezie- 
hung stehende Daten, welche über eindeutige Bezeichner identifiziert wer- 
den. Die Bezeichner fungieren dabei zugleich als Identifikatoren für Ressour- 
cen im World Wide Web, unter welchen die mit einem Bezeichner verbunde- 
ne, intendierte Bedeutung, z. B. in Form einer Beschreibung, hinterlegt wird. 
Auch die Arten der verwendeten Beziehungen zwischen Daten werden auf 
diese Weise beschrieben. Als Teil des Semantic Web wird Linked Data mittels 
RDF’ und ggf. OWL als Repräsentationssprachen dargestellt. 


Ein Beispiel für Linked Open Data ist die Wissensbasis des DBPedia Pro- 
jekts [Leh15], welches aus Wikipedia extrahiertes Wissen aufbereitet und 
formal repräsentiert. Zur Einordnung des zumeist aus den strukturierten 
Anteilen von Wikipedia-Seiten extrahierten Wissens wird eine eigens er- 
stellte Ontologie verwendet, die allerdings nicht die Kriterien einer allge- 
meinen Top-Level Ontologie (wie beispielsweise Aufgabenunabhängigkeit) 


* Resource Description Framework, s. Abschnitt 2.2.3 
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erfüllt. Die erstellte Wissensbasis ist sehr umfangreich und enthält, analog 
zu Wikipedia, Wissen zu vielen unterschiedlichen Domänen. Dabei zählen 
insbesondere Personen und Orte zu den am häufigsten repräsentierten In- 
formationen. Ein ähnliches Vorgehen wird auch von Projekt YAGO [Reb16] 
verfolgt. Auch hier wird Wissen aus Wikipedia extrahiert und strukturiert 
dargestellt, wobei besonderer Wert auf die Qualität der extrahierten Daten 
gelegt wird. Zur taxonomischen Strukturierung des extrahierten Wissens 
wird WordNet verwendet. 


In den zuvor genannten Wissensbasen wird Allgemeinwissen über die Welt 
und teilweise Domänenwissen formal dargestellt. Viele der Wissensbasen 
sind untereinander vernetzt und stellen ihr Wissen in Form von RDF Tripeln 
frei zur Verfügung. Durch die Art des enthaltenen Wissens, z. B. bzgl. Detail- 
grad und Formalisierung, sind diese Wissensbasen nicht direkt als Hinter- 
grundwissensmodell für die Umweltmodellierung geeignet. Sie können je- 
doch wertvollen Quellen für die Erstellung eines Modells und dessen semi- 
automatische Ergänzung darstellen. 


Top-Level Ontologien 


Neben den eigentlichen Inhalten eines Wissensmodells ist dessen grundle- 
gende kategorische Strukturierung, nach welcher Wissen angeordnet wird, 
ein wesentlicher Aspekt für die Umweltmodellierung. Für Ontologien wird 
eine derartige Strukturierung im Idealfall in Form einer Top-Level Ontolo- 
gie beschrieben. Viele der formaleren Wissensmodelle definieren explizite 
Top-Level Ontologien für ihre Wissensbasen. Da Top-Level Ontologien mit 
Hinblick auf Wiederverwendbarkeit entworfen werden, stellen sie bzgl. der 
möglichen Strukturierung der Wissensrepräsentation für die Umweltmodel- 
lierung relevante Literatur dar. 


Das bereits erwähnt Projekt Cyc [Len95] definiert eine umfangreiche 
Wissensbasis, welche auf einer explizit formulierten Top-Level Ontologie 
basiert. Unterhalb dieser Top-Level Ontologie sind sog. Mikrotheorien auf 
unterschiedlichen Ebenen angesiedelt, welche auf tieferen Ebenen getrennt 


57 


2 Stand der Technik und Wissenschaft 


voneinander spezifische Anwendungsbereiche beschreiben. Top-Level On- 
tologie und Wissensbasis werden in einer eigenen Repräsentationssprache 
namens CycL dargestellt, welche in Teilen eine Logik höherer Stufe darstellt 
[Mat06]. Das Projekt stellt weiterhin eine eigene Inferenzmaschine für diese 
Sprache bereit. Die Top-Level Ontologie von Cyc unterscheidet inhaltlich 
Kategorien wie Individuen von Sammlungen, anfassbare von teilweise 
nicht anfassbaren Individuen, räumliche von zeitlichen Individuen usw. 
Die Wissensbasis an sich beschreibt Allgemeinwissen sowie domänen- und 
anwendungsspezifisches Wissen für viele Teilbereiche. Wissensbasis und 
Top-Level Ontologie sind proprietär, für einen Zeitraum existierte jedoch 
mit OpenCyc auch eine im Umfang reduzierte, frei zugängliche Variante. 


Eine weitere Top-Level Ontologie ist mit der Suggested Upper Merged 
Ontology (SUMO) [Nil01] gegeben. Diese Top-Level Ontologie wurde 
als Verschmelzung von mehreren vorausgehenden Top-Level Ontologien 
erstellt, darunter Ontologien von Sowa [Sow99] sowie von Russell und 
Norvig [Rus10]. Die Ontologie ist in einer Version des Wissensaustausch- 
formats KIF' beschrieben. Die Top-Level Ontologie unterscheidet inhaltlich 
Physisches von Abstraktem. Als Physisches werden dabei Objekte von 
Prozessen sowie ganzheitliche Objekte von Sammlungen unterschieden. 
Als Abstraktes werden Attribute von Relationen unterschieden etc. Die An- 
wendungsgebiete der Top-Level Ontologie liegen in den Bereichen Suche, 
Linguistik und Schlussfolgern. Die Top-Level Ontologie wird zusätzlich 
durch entsprechende Domänen-Ontologien für spezifische Anwendungs- 
bereiche ergänzt und ist frei verfügbar. 


Eine weitere, ebenfalls frei verfügbare Top-Level Ontologie stellt DOLCE 
[Mas03] dar. Diese Top-Level Ontologie wurde im WonderWeb Projekt 
entwickelt, welches die Erstellung einer Bibliothek von Ontologien zum 
Ziel hatte. DOLCE diente in dieser Bibliothek als Ausgangspunkt für die 
Entwicklung und Integration weiterer grundlegender Ontologien. DOLCE 
selbst ist eine reine Top-Level Ontologie, welche in Prädikatenlogik be- 
schrieben und stark axiomatisiert ist. Neben Ausdrucksstärke stand bei der 


* Knowledge Interchange Format 
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Entwicklung von DOLCE auch die Fundierung von Entwurfsentscheidungen 
auf Prinzipien der formalen Ontologie im Vordergrund’. In der Top-Level 
Ontologie wird Abstraktes von Qualitäten sowie raumzeitlichen Entitäten 
unterschieden. Entitäten existieren dabei entweder zu jedem einzelnen 
Zeitpunkt vollständig oder zu jedem Zeitpunkt nur teilweise und dafür in 
der Zeit. Weiterhin wird Physisches von Nichtphysischem und Handelndes 
von Gegenständlichem unterschieden. DOLCE als Top-Level Ontologie ist 
dabei insgesamt auf eine Modellierung von Kategorien ausgerichtet, welche 
menschlicher Sprache und Allgemeinwissen zugrunde liegen. 


Die genannten Top-Level Ontologien stellen strukturierte Ansätze dar, mit- 
tels derer sich Domänenwissen in einem Hintergrundwissensmodell inhalt- 
lich gegliedert repräsentieren lässt. Die Ansätze unterscheiden sich dabei in 
Bezug auf die Art, wie solches Wissen grundsätzlich kategorisiert wird. Für 
alle genannten Ansätze existiert eine Formalisierung in OWL DL, für SU- 
MO und DOLCE ist diese frei verfügbar. 


Spezialisierte Wissensmodelle 


Neben der kategorischen Strukturierung eines Wissensmodells existieren 
weitere Aspekte, die domänenübergreifenden Charakter haben und somit 
unabhängig von einer konkreten Anwendung beschrieben werden können. 
Dazu zählen z.B. die Darstellung von Raum, Zeit und Einheiten. Für Raum 
und Zeit betrifft dies die Darstellung punktueller Informationen (wie Positio- 
nen oder Zeitpunkte) und regionenbezogener Informationen (Gebiete, Zeit- 
intervalle). Weiterhin ist auch die Definition von Beziehungen zwischen sol- 
chen Informationen betroffen (z. B. räumliche oder zeitliche Nachbarschafts- 
, Enthaltenseins- und Unterschiedlichkeits-Beziehungen). 


Raum Die Darstellung von Raum bzw. Ort besitzt ebenfalls unterschiedli- 
che Aspekte. Einerseits können mit Positionen Orte für Entitäten angegeben 
werden. Dies kann z. B. metrisch mit Bezug zu einem Koordinatensystem er- 
folgen. Andererseits kann Raum nach Bateman und Farrar [Bat06] auch als 


* vgl. Abschnitt 2.2.3 zur OntoClean Methodik 
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eine grundlegende ontologische Qualitat betrachtet werden und dabei auf 
unterschiedliche Arten konzeptualisiert und formalisiert werden. Hier spie- 
len räumliche Beziehungen unterschiedlicher Arten eine wichtige Rolle. 


Soll für ein betrachtetes Objekt seine Position angegeben werden, so be- 
steht ein häufiges Vorgehen darin, diese Position mit einem Punkt in ei- 
nem entsprechenden Koordinatensystem zu identifizieren. Dies kann geo- 
metrisch erfolgen, unter Verwendung eines zwei- oder dreidimensionalen 
kartesischen Koordinatensystems. Die einzelnen Koordinaten einer Position 
werden dabei metrisch als Längen mit entsprechender Maßeinheit angege- 
ben. Neben geometrischen Koordinatensystemen können auch geographi- 
sche Koordinatensysteme genutzt werden, z.B. um die Position von Objek- 
ten auf der Erdoberfläche anzugeben. Positionen werden hier häufig mittels 
zweier Koordinaten beschrieben. Für eine eindeutige Interpretation solcher 
Angaben wird allerdings weiterhin ein sog. geodätisches Datum benötigt, 
welches Ursprung und Orientierung eines geographischen Koordinatensys- 
tems in Bezug auf den Erdkörper festlegt. Zusammen werden das Koordina- 
tensystem und das geodätische Datum als Koordinatenreferenzsystem be- 
zeichnet. Beispiele für solche geodätischen Referenzsysteme sind das World 
Geodetic System 1984 (WGS84) [NIM00] sowie das UTM-System’. In WGS84 
werden Positionen von Objekten auf der Erdoberfläche über die Angabe der 
geographischen Länge und Breite beschrieben. 


Allgemein lassen sich lokale bzw. relative Koordinatensysteme von globa- 
len oder Weltkoordinatensystemen unterscheiden. Durch die Angabe eines 
geodätischen Datums wird ein lokales geographisches Koordinatensystem 
z.B. zu einem globalen Koordinatensystem. Diese Unterscheidung gilt eben- 
so für geometrische Koordinatensysteme. Beispielsweise müssen Ortsanga- 
ben in den lokalen Koordinatensystemen verschiedener Serviceroboter für 
einen Vergleich oder eine weitere Verarbeitung zunächst in ein gemeinsa- 
mes Weltkoordinatensystem umgerechnet werden. Zu diesem Zweck kön- 
nen entsprechende Koordinaten-Transformationen genutzt werden. 


1 Universal Transverse Mercator 
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Die Darstellung von Positionen mittels metrischer Koordinatensysteme ist 
fiir eine technische Informationsverarbeitung hilfreich. In Situationen des 
menschlichen Alltags spielt diese Art der Ortsdarstellung allerdings nur eine 
untergeordnete Rolle. Hier steht eine andere Art der Referenzierung von Ort 
und Raum im Vordergrund, welche von qualitativer Natur ist und sich räum- 
licher Beziehungen bedient [Bat06]. Dies spiegelt sich auch in der mensch- 
lichen Sprache wieder. Diese Art der Ortsdarstellung ist somit auch für eine 
Repräsentation von raumbezogenen Vorwissen auf semantischer und prag- 
matischer Ebene relevant. 


Hierbei wird Raum als eine grundlegende ontologische Qualität aufgefasst. 
Die Instanzen dieser Qualität stellen z.B. räumliche Regionen dar. Regio- 
nen können gegenüber Punkten dabei als eine natürliche Repräsentation 
und ein kognitiv motiviertes Grundprimitiv zur Darstellung von Raum be- 
trachtet werden [Bat06]. Um bei diesem Vorgehen raumbezogene Aspekte 
und Eigenschaften von relevanten Entitäten einer Domäne beschreiben zu 
können, werden diese Objekte in Abstraktion ihrer weiteren Eigenschaften 
mit den von ihnen eingenommen räumlichen Regionen identifiziert. 


Um Wissen über räumliche Regionen (und somit auch die raumbezogenen 
Aspekte von Entitäten) in Form von Aussagen darstellen zu können, werden 
räumliche Relationen benötigt. Diese Relationen beschreiben dabei qualita- 
tives Wissen. Als grundlegende Relationen werden in [Bat06] Teile-Ganzes- 
Beziehungen, Verbundenheit und Gleichheit zwischen Regionen genannt so- 
wie Beziehungen zwischen Entitäten und Regionen, welche zur Verortung 
der Entitäten dienen. Als Arten von Relationen lassen sich topologische Re- 
lationen von Richtungs- und Abstandsbeziehungen unterscheiden [Pul88]. 
Letztere beinhalten Beziehungen wie „vor“, „hinter“, „links von“ oder „nahe 
bei“ und stellen meist symbolische Relationen dar. Topologische Relationen 
wie „gleich“, „berührt“, „enthält“, „überlappt“ etc. können dagegen mittels 
Logik formal in ihrer Bedeutung definiert werden. Somit lassen sie sich in 
Kalkülen wie dem Region Connection Calculus (z.B. als RCC8) [Ran92] zum 
raumbezogenen Schlussfolgern verwenden. Einen umfassenden Ansatz zur 
formalen Beschreibung der möglichen topologischen Beziehungen zwischen 
zwei gegebenen (zweidimensionalen) räumlichen Regionen stellt das sog. 
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DE-9IM' Modell [Cle93] dar. In diesem Modell können formal 512 verschie- 
dene Beziehungen zwischen Regionen unterschieden werden. Diese forma- 
len Beziehungen werden genutzt um verallgemeinerte, vor allem dimensi- 
onsunabhängige, präzise Relationen für Regionen zu definieren. 


Für die Darstellung von Raum in existierenden Umweltmodellen, wie z.B. 
den zuvor vorgestellten, lassen sich ebenfalls die genannten unterschiedli- 
chen Betrachtungsweisen von Raum erkennen. So werden z.B. lokale me- 
trische Karten über topologische Beziehungen verknüpft, um eine globale 
Repräsentation des relevanten Raums zu erreichen. Durch die Verknüpfung 
der menschlichen Vorstellung von Raum, wie über Sprache ausgedrückt, mit 
der technischen Repräsentation entstehen somit semantische Modelle. 


Auch einige der genannten Top-Level Ontologien, darunter SUMO und Cyc, 
beinhalten bereits einige Formalisierungen der Art und Weise, wie Raum 
und räumliche Positionen betrachtet werden, und definieren entsprechende 
räumliche Beziehungen [Bat06]. Andere, wie DOLCE, legen nur allgemein 
die Art und Weise fest, wie Raum als eine ontologische Qualität repräsen- 
tiert wird und überlassen die detaillierte Modellierung im Bedarfsfall unter- 
geordneten, detaillierteren Ontologien. 


Zeit Zur Modellierung von Zeit existieren viele unterschiedliche ontologi- 
sche Ansätze. Einen im Bereich des Semantic Web relevanten Ansatz stellt 
die Ontologie OWL-Time dar [W3C20], eine in OWL 2 DL repräsentierte 
Formalisierung von Zeitintervallen und Zeitpunkten sowie zeitlichen Re- 
lationen. Der Ontologie liegt eine prädikatenlogische Axiomatisierung zu- 
grunde, welche angepasst in Beschreibungslogik übernommen wurde. Zeit- 
punkte werden dabei als Spezialfall eines Zeitintervalls mit Lange 0 betrach- 
tet. Zur Repräsentation von Zeitpunkten mit Datum wird in OWL-Time 
u.a. auf zwei Grundprimitiven aus OWL aufgebaut, welche XML Datenty- 
pen entsprechen. Einen alternativen Ansatz stellt das Date-Time Vocabulary 
[Lin12] dar, für welches ebenfalls eine OWL 2 Fassung existiert. Auch ei- 
nige Top-Level Ontologien machen Aussagen über die Repräsentation von 
Zeit. Für DOLCE gilt z.B. dieselbe allgemeine Herangehensweise wie für die 


* Dimensionally Extended nine-Intersection Model 
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Darstellung von Raum, in welcher Zeit unspezifisch als eine der möglichen 
Qualitäten einer Entität behandelt wird, welche Werte innerhalb einer zeitli- 
chen Region besitzt. Eine weitere Spezifizierung dieser Grundstruktur wird 
untergeordneten Ontologien überlassen. Die Konzepte von Zeit und Raum 
werden in DOLCE allerdings in der grundlegenden Strukturierung zur Un- 
terscheidung von Kategorien genutzt. Weiterhin können auch die Beziehun- 
gen zwischen Zeitintervallen und Zeitpunkten formal durch zeitliche Rela- 
tionen („vor“, „nach“, „enthält“ etc.) beschrieben werden. Auf Basis solcher 
Relationen kann dann mittels temporaler Kalküle wie Allens Intervallalge- 
bra [All83] temporal geschlussfolgert werden. 


Maßeinheiten Ein weiterer wichtiger Aspekt für die Umweltmodellierung 
ist die einheitenbehaftete Darstellung von erfassten Werten, z.B. in Bezug 
auf die Merkmale beobachteter Objekte. In einem Modell kann diesbezüg- 
lich Wissen über unterschiedliche existierende Einheiten für physikalische 
Größen und mögliche Konvertierungen zwischen diesen Einheiten darge- 
stellt werden. Es existieren unterschiedliche Modelle, welche diese Thematik 
betrachten. Ein Teil dieser Modelle wird von Keil und Schindler [Kei19] ge- 
genübergestellt und verglichen. Eines dieser Modelle ist die sog. Quantities, 
Units, Dimensions and Data Types* (QUDT) Ontologie, ein NASA initiier- 
tes Projekt zur Beschreibung von physikalischen Größen, ihren Einheiten 
und den Zusammenhängen zwischen unterschiedlichen Größen. Auch Sys- 
teme von Größen und Einheiten werden betrachtet. Unter anderem werden 
in QUDT physikalischen Größen anwendbare Einheiten zugeordnet sowie 
Konversionen zwischen unterschiedlichen Einheiten für eine physikalische 
Größe beschrieben. Dabei werden auch Einheiten für raum- und zeitbezoge- 
ne Größen beschrieben. Das Modell ist in einer in OWL formalisierten Fas- 
sung verfügbar. Eine weitere Ontologie für Maßeinheiten wird von Rijgers- 
berg definiert [Rij13]. Die Ontologie ist in OWL 2 beschrieben und betrachtet 
ebenfalls physikalische Größen sowie für sie anwendbare Einheiten. Dabei 
werden explizit auch Präfixe (wie Kilo, Milli etc.) für Einheiten betrachtet 
und die Faktoren für eine Konvertierung zur Einheit ohne Präfix modelliert. 


* http://www.qudt.org (letzter Abruf: 13.05.2020) 
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Ebenso werden Konvertierungen zwischen allgemeinen Einheiten beschrie- 
ben. Auch Skalenniveaus werden modelliert. Die Kategorisierung der Onto- 
logie wird mit der Strukturierung der Top-Level Ontologie DOLCE vergli- 
chen, wobei einige Abweichungen festgestellt werden. Eine mégliche Inte- 
gration in DOLCE wird daher als interessanter Aspekt beschrieben, der aber 
noch genauer untersucht werden muss. 


2.3.3 Zusammenfassung zu existierenden Wissens- und 
Umweltmodellen 


Es existieren zahlreiche formale Wissensmodelle und -basen, welche im Be- 
reich der künstlichen Intelligenz zur Unterstützung von Anwendungen ein- 
gesetzt werden können. Diese Wissensmodelle stellen wertvolle Quellen für 
bereits formalisierte Informationen dar. Die konkrete Anwendbarkeit muss 
jedoch im Einzelfall in Bezug auf die Anforderungen eines Anwendungs- 
falls, die dort betrachtete Domäne sowie den zugrunde gelegten Bias (bzgl. 
Aspekten wie Abstraktionsniveau etc.) geprüft werden. 


Die Wissensmodelle setzen unterschiedliche Formalismen zur Repräsentati- 
on von Wissen ein, wobei auch hier vermehrt OWL genutzt wird. Weiterhin 
werden unterschiedliche grundlegende Kategorisierungen in Form von Top- 
Level Ontologien angenommen. Top-Level Ontologien stellen dabei vielver- 
sprechende Ausgangspunkte zur Entwicklung von nichttrivialen Domänen- 
modellen dar. Spezialisierte Wissensmodelle betrachten detailliert spezifi- 
sche Aspekte wie die Darstellung von Ort, Zeit und Maßeinheiten. Die Wie- 
derverwendung von zumindest Teilen solcher Modelle stellt ebenfalls einen 
Mehrwert dar, muss jedoch auch im Einzelfall geprüft werden. 
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Im Bereich der Umweltmodellierung nutzen andere Ansätze ebenfalls logi- 
sche oder logisch-probabilistische Sprachen zur Repräsentation von Domä- 
nenwissen. Die erstellten Domänenmodelle sind dabei meistens sehr spezi- 
ell auf eine Domäne zugeschnitten und dienen häufig zur Erkennung vor- 
gegebener Situationen. Dies gilt z.B. für Ansätze aus dem Bereich des au- 
tonomen Fahrens. Allgemein dienen die Umweltmodelle häufig der Unter- 
stützung von Situationsbewusstsein, indem sie z.B. das Ziehen von Schluss- 
folgerungen ermöglichen. Komplexere Wissensmodelle werden im Bereich 
der Servicerobotik eingesetzt. Diese Modelle sollen Serviceroboter intelli- 
gentes autonomes Verfahren ermöglichen, z.B. bei der Ausführung von All- 
tagsaufgaben. Mit KnowRob existiert dabei eine umfangreiche formale Wis- 
sensbasis, welche sowohl Alltagswissen bzgl. menschlicher Handlungen als 
auch Informationen für eine Erkennung von Objekten beinhaltet bzw. semi- 
automatisiert erwerben kann. Eine Darstellung von probabilistischen Infor- 
mationen wird allerdings auch hier nur zum Zwecke des Schlussfolgerns 
unterstützt, auf Basis einer Teilmenge des Modells. Auch folgen die semi- 
automatisch erworbenen Modellanteile nicht notwendigerweise Prinzipien 
der formalen Ontologie zur Strukturierung von Wissen. 


2.4 Umweltmodellierung für offene Welten 


In dieser Arbeit wird als ein zentrales Thema die adaptive Umweltmodellie- 
rung betrachtet. Diese betrifft die Fragestellung, wie ein Umweltmodell da- 
zu in die Lage versetzt werden kann, sein genutztes Wissensmodell adaptiv 
an eine beobachtete Situation anzupassen. Neben der Fähigkeit, den Bedarf 
für eine solche Anpassung festzustellen, muss ein Umweltmodell zu diesem 
Zweck zu konkreten Ergänzungen und Anpassungen seines Hintergrund- 
wissensmodells befähigt werden. Dabei geht die adaptive Umweltmodellie- 
rung davon aus, dass ein bereits existierendes Wissensmodell anzupassen 
ist, und nicht ein Modell vollständig neu zu erstellen ist. Die Anpassungen 
eines Hintergrundwissensmodells finden somit auf der Ebene der bisher im 
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Modell enthaltenen Konzepte statt. Ergänzungen des Modells betreffen da- 
bei das Erlernen neuer Konzepte auf Basis von in der Umgebung beobach- 
teten Entitäten. Weiterhin ist von Interesse, nach welchen Prinzipien solche 
Erweiterungen eines Modells stattfinden sollen. In Bezug auf die genannten 
Aspekte stellt dieser Abschnitt relevante Literatur vor. Da das Thema der ad- 
aptiven Umweltmodellierung eine spezifische Problemstellung auf Basis der 
objektorientierten Umweltmodellierung darstellt, sind hiervon verschiedene 
Bereiche betroffen, die allerdings nur im Überblick vorgestellt werden. Dabei 
wird in Abschnitt 2.4.1 zunächst das Thema des maschinellen Konzeptler- 
nens betrachtet. Abschnitt 2.4.2 gibt anschließend einen Überblick über das 
Thema des Ontologie-Lernens. In Abschnitt 2.4.3 werden weiterhin kogniti- 
ve Architekturen in Bezug auf die adaptive Umweltmodellierung betrachtet. 
Abschnitt 2.4.4 stellt schließlich zwei spezifische Ansätze mit Bezug zur ad- 
aptiven Umweltmodellierung vor. 


2.4.1 Konzeptlernen 


Das Erlernen neuer Konzept stellt eine zentrale Aufgabe der adaptiven Um- 
weltmodellierung dar. Als Lernbeispiele, auf Basis derer neue Konzepte de- 
finiert werden sollen, dienen dabei in der Umgebung beobachtete und an- 
schließend im Weltmodell repräsentierte Entitäten und ihre Eigenschaften. 
Diese Eigenschaften werden im Fall des objektorientierten Umweltmodells 
in Form von Wahrscheinlichkeitsverteilungen beschrieben, was z.B. gegen- 
über dem klassischen Konzeptlernen eine erweiterte Ausgangssituation dar- 
stellt. Die nachfolgende Darstellung des klassischen Konzeptlernens basiert 
auf [Kuw10]. 


Klassisches Konzeptlernen 


Der klassische Ansatz zum Konzeptlernen befasst sich mit dem Lernen von 
booleschen Funktionen aus Beispielen [Mit97]. Ein Konzept wird dabei als 
eine boolesche Funktion betrachtet, welche Instanzen, die durch ihre Attri- 
butwerte repräsentiert werden, auf einen Wert von 1 (Konzeptzugehörigkeit) 
oder 0 (Nicht-Zugehörigkeit) abbildet. Die Menge der möglichen Instanzen 
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wird somit durch das kartesische Produkt der betrachteten Attributdomanen 
definiert, die oft aus diskreten Werten bestehen. Jede Instanz in der Menge 
der Trainingsdaten ist dabei als positives oder negatives Beispiel des Kon- 
zepts gekennzeichnet. Um ein Zielkonzept zu erlernen, werden die Konzepte 
als Hypothesen dargestellt, d. h. als Konjunktionen von Einschränkungen an 
die zulässigen Attributwerte. Dabei kann für ein bestimmtes Attribut z.B. 
jeder beliebige Wert erlaubt sein oder auch nur ein bestimmter Wert. Die 
Aufgabe des Konzeptlernens besteht dann darin, eine Hypothese zu finden, 
die mit den Trainingsdaten übereinstimmt. Diese Aufgabe kann als gezielte 
Suche im Hypothesenraum durchgeführt werden unter Ausnutzung einer 
Ordnung der Hypothesen bzgl. ihrer Allgemeinheit. Eine Hypothese gilt da- 
bei als allgemeiner als eine andere, wenn die Menge der für sie zulässigen 
Instanzen eine Obermenge zur Menge der zulässigen Instanzen der ande- 
ren Hypothese darstellt. Basierend auf dieser Ordnung wurden verschiede- 
ne Lernalgorithmen für Konzepte entwickelt, darunter der Versionsraum- 
Algorithmus! von Mitchell [Mit79]. 


Induktive Inferenz Der induktive Bias des klassischen Konzeptlernens 
wird teilweise bereits durch die gewählte Struktur der Hypothesenreprä- 
sentation bestimmt. Ist beispielsweise ein Zielkonzept nicht als Hypothese 
darstellbar, so kann es folglich auch nicht gelernt werden. 


Für die allgemeine Aufgabe, aus Beispielen zu lernen, wird eine Menge von 
Stichproben oder Trainingsdaten (X,,¥,),(X2,)2), --- » (Xn»Yn) als gegeben an- 
genommen, wobei x; den beobachtbaren Teil der Daten und y; eine Bewer- 
tung dieser Daten darstellt. Soll ein funktionaler Zusammenhang zwischen 
den x;- und y;-Werten gelernt werden, so wird diese Aufgabe im Bereich der 
Statistik als Regression und im Bereich des maschinellen Lernens als über- 
wachtes Lernen bezeichnet [Grü07]. Der speziellere Fall, in welchem die y;- 
Werte auf eine endliche Menge beschränkt sind, wird als Klassifikation oder, 
im Speziellen, als Konzeptlernen bezeichnet. 


Englisch: Version Space 
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Das automatische Lernen aus einer kleinen Anzahl von Beispielen ist eine 
schwierige Aufgabe, insbesondere wenn die resultierende funktionale Be- 
ziehung oder der Klassifikator auch in der Lage sein soll, bisher ungesehene 
Daten gut vorherzusagen (sog. Generalisierungsfahigkeit). Für ein erfolgrei- 
ches Lernen sind neben den Trainingsdaten somit noch weitere Annahmen 
bzgl. des gegebenen Problems notwendig. Diese Annahmen können einen 
starken Einfluss auf die inferierte Generalisierung haben und werden da- 
her als induktiver Bias bezeichnet [Mit80]. Ein prominentes Beispiel für den 
induktiven Bias beim Konzeptlernen stellt die Struktur des Raums der mög- 
lichen Hypothesen dar. Da Inferenzverfahren beim Lernen die Zielhypothe- 
sen nur aus diesem Raum auswählen können, sind nicht darstellbare Hy- 
pothesen daher a priori ausgeschlossen. Die Struktur des Hypothesenraums 
bzw. der induktive Bias muss somit auch in der adaptiven Umweltmodellie- 
rung beachtet werden. 


Hierarchisches Konzeptlernen 


Mit dem Erlernen von Konzepten beschäftigt sich auch das Gebiet der nume- 
rischen Taxonomie [Sok66], welches in [Kuw12a] betrachtet wurde. Dieses 
Gebiet betrifft die biologische Taxonomie und wurde ursprünglich entwi- 
ckelt, um eine objektive Taxonomie für biologische Organismen anhand von 
quantitativ erfassbaren diskreten Merkmalen dieser Organismen erstellen zu 
können. Das methodische Ziel ist dabei, eine gegebene Menge von Objek- 
ten anhand der quantitativen Ähnlichkeit ihrer Merkmale unüberwacht in 
Gruppen einzuteilen. Diese Gruppen können wiederum hierarchisch ange- 
ordnet sein. Damit wird in der numerischen Taxonomie bereits eine Art der 
agglomerativen hierarchischen Clusteranalyse umgesetzt. Die numerische 
Taxonomie definiert dazu unterschiedliche Maße, mit denen die Ähnlichkeit 
von Objekten aufgrund ihrer Merkmale bewertet werden kann. 


Eine tatsächliche Beschreibung der erzeugten Gruppen im Sinne einer Kon- 
zeptdefinition wird in der numerischen Taxonomie allerdings nicht erzeugt. 
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Eine solche Beschreibung führen allerdings die Methoden der konzeptuel- 
len Clusteranalyse' von Fischer mit COBWEB [Fis87] und seinen Erweite- 
rungen für kardinale Attribute (z.B. CLASSIT [Gen89]) ein. Die konzeptu- 
elle Clusteranalyse hat dabei zum Ziel, gegebene Daten (Objekte und de- 
ren diskrete Attribute) auf eine verständliche Weise zusammenzufassen und 
zu abstrahieren [Fis87]. Zu diesem Zweck werden für Cluster Beschreibun- 
gen erzeugt, welche das durch ein Cluster dargestellte Konzept im Sinne 
einer Definition beschreiben. Die Beschreibung erfolgt probabilistisch als ei- 
ne Statistik über die bisher beobachteten Attributwerte der Instanzen dieses 
Clusters und wird als ein probabilistisches Konzept bezeichnet. Die Wahr- 
scheinlichkeit eines Attributwerts wird dabei als eine bedingte Wahrschein- 
lichkeit dargestellt, wobei als Bedingung die probabilistischen Konzepte ge- 
nutzt werden. Diese Beschreibung wird im Verfahren weiterhin auch zur 
Bestimmung der Cluster genutzt. Das leitende Prinzip ist es dabei, Clus- 
ter zu erzeugen, deren Beschreibung die Vorhersage von möglichst vielen 
Informationen über bisher ungesehene Instanzen des Clusters erlaubt, im 
Sinne einer erwarteten Anzahl an korrekt vorhergesagten Attributwerten. 
Die genutzte Metrik wird dabei als Kategorie-Nützlichkeit bezeichnet. Das 
in COBWEB umgesetzte Verfahren zur konzeptuellen Clusteranalyse ist un- 
überwacht und inkrementell. 


2.4.2 Ontologie-Lernen 


Die vorgestellten Arten des maschinellen Konzeptlernens betreffen das Ler- 
nen symbolischer Konzeptdefinitionen aufgrund von symbolisch oder nu- 
merisch dargestellten Attributen. Als Konzepte werden dabei mathematisch 
dargestellte Hypothesen gelernt. 


Eine ähnliche Fragestellung und auch darüber hinausgehende Aspekte wer- 
den strukturiert auch im Bereich des Ontologie-Lernens betrachtet. Hier- 
bei ist es das Ziel, Definitionen und eine Axiomatisierung für die Konzepte 
und Relationen einer Ontologie zu erlernen, z.B. auf Basis von textuellen 


Englisch: conceptual clustering 
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Ressourcen. Beim Ontologie-Lernen erstellte Definitionen miissen im Ver- 
gleich zum klassischen Konzeptlernen in der Repräsentationssprache der 
Ontologie dargestellt werden, z.B. also in OWL. Das Lernen von Ontolo- 
gien erfolgt in der Regel schichtenweise [Cim06]. Zuerst werden relevante 
Begriffe und ihre Synonyme bestimmt. Auf dieser Grundlage werden Kon- 
zepte definiert und diese anschließend taxonomisch angeordnet. Weiterhin 
werden Relationen definiert und ebenfalls taxonomisch angeordnet. Schließ- 
lich werden darauf aufbauend Axiome gelernt. Dieses schrittweise Vorgehen 
im Ontologie-Lernen besitzt dabei eine deutliche Ähnlichkeit zum Vorgehen 
beim manuellen Ontologie-Entwurf (vgl. 2.2.3). Ontologie-Lernen kann lexi- 
kalisch auf Basis textueller Ressourcen und unter Verwendung von Metho- 
den zur Verarbeitung natürlicher Sprache, statistisch oder logisch erfolgen 
[Asi18]. Ein wichtiger Aspekt des lexikalischen Ontologie-Lernens ist, dass 
neben Konzeptdefinitionen auch konkrete Bedingungen an die Beziehungen 
* zwischen Konzepten als Axiome gelernt werden können [V6109]. Das Er- 
lernen von Ontologien erfolgt in der Regel semi-automatisch [V6109] und 
unter einer manuellen Evaluation der gelernten Ontologien [Asi18]. 


Die Nutzung von textuellen Ressourcen beim Ontologie-Lernen geht über 
den Fokus der adaptiven Umweltmodellierung in dieser Arbeit hinaus, er- 
möglicht allerdings das Erlernen von semantischen und nicht aus Umge- 
bungsbeobachtungen ableitbaren Informationen für ein Wissensmodell. Das 
Themengebiet des Ontologie-Lernens kann somit als komplementär zum in 
dieser Arbeit vorgestellten Ansatz für die adaptive Umweltmodellierung an- 
gesehen werden. Die Methoden des Ontologie-Lernens könnten z. B. genutzt 
werden, um aus Umgebungsbeobachtungen erlernte Konzepte um seman- 
tische Informationen zu erweitern. Als einen ersten Schritt in eine solche 
Richtung stellt Abschnitt 8.3.3 eine mögliche Erweiterung der adaptiven Um- 
weltmodellierung durch Integration externen semantischen Wissens vor. 


* Englisch: property restrictions 
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2.4.3 Kognitive Architekturen 


Neben dem tatsächlichen Erlernen neuer Konzepte spielen in der adaptiven 
Umweltmodellierung auch Fragen eine Rolle, wie unter welchen Umstän- 
den und auf welche Art und Weise ein Wissensmodell erweitert und an- 
gepasst werden sollte. In Bezug auf solche Fragen können Denkanstöße in 
den Erkenntnissen der Kognitionswissenschaften zum menschlichen Kon- 
zeptlernen gefunden werden. Im Speziellen sind für diesen Zweck kogniti- 
ve Architekturen relevant. Kognitive Architekturen stellen dabei implemen- 
tierte und ausführbare Modelle der menschlichen Kognition dar, welche auf 
einer entsprechenden Kognitionstheorie beruhen [Bac03]. Kognitive Archi- 
tekturen können in ihren Grundbegriffen auf abstrakte Weise auch zur ob- 
jektorientierten Umweltmodellierung ähnlich sein. So besitzen z. B. manche 
kognitive Architekturen begrifflich auch ein Weltmodell. Da in dieser Ar- 
beit die adaptive Umweltmodellierung im Mittelpunkt steht, soll an dieser 
Stelle nicht weiter auf grundsätzliche Ähnlichkeiten zur objektorientierten 
Umweltmodellierung eingegangen werden. Stattdessen sollen die fiir die ad- 
aptive Wissensverwaltung relevanten Aspekte in kognitiven Architekturen 
betrachtet werden. Dies betrifft z.B. Prinzipien, nach welchen sich die adap- 
tive Umweltmodellierung in ihrem Vorgehen richten kann. Als ein Beispiel 
soll hier die MicroPsi Architektur [Bac03, Bac07] von Bach genannt wer- 
den. In dieser kognitiven Architektur werden beispielsweise Kategorien für 
Objekte durch die Verallgemeinerung von Objektrepräsentationen gewon- 
nen. Die als Grundlage betrachteten Objekte müssen dabei alle hinreichend 
ähnlich sein. Informationen über beobachtete Objekte werden in einem Pro- 
tokoll gespeichert. Die Inhalte dieses Protokollspeichers sind in regelmäßi- 
gen Abständen Gegenstand einer Weiterverarbeitung, welche in MicroPsi 
als Reflektion bezeichnet wird. Ziel dieser Reflektion ist es, die Inhalte des 
Protokollspeichers zu komprimieren, indem enthaltene Objekte durch ih- 
re Kategorien ersetzt und dargestellt werden. Der Erwerb neuer komplexer 
Konzepte oder Kategorien erfolgt in MicroPsi nicht in einem Schritt, sondern 
betrachtet über das Protokoll immer eine Historie von Perzeptionsschritten. 
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Die Grundsätze und Prinzipien des genannten Vorgehens von kognitiven 
Architekturen können nun auf angepasste Weise auch in der adaptiven Um- 
weltmodellierung Beachtung finden. Einige der in Kapitel 8 dargestellten 
Anteile der adaptiven Wissensverwaltung lassen sich somit über Denkan- 
stöße aus der menschlichen Kognition motivieren und begründen. 


2.4.4 Spezifische Ansätze 


Von Daoutis [Dao12, Dao13] wird ein insgesamt ähnlicher Ansatz wie in der 
adaptiven Umweltmodellierung betrachtet. Dabei wird zunächst von einer 
ähnlichen Problemstellung wie der des objektorientierten Umweltmodells 
ausgegangen, für das Anwendungsgebiet der kognitiven Robotik. Im Mittel- 
punkt der Arbeit steht die Verankerung! von Sensordaten bzgl. wahrgenom- 
mener physischer Objekte in semantischen Konzepten [Dao13]. Diese Kon- 
zepte dienen dabei ähnlich wie in der objektorientierten Umweltmodellie- 
rung zu einer Vervollständigung von wahrgenommenen Objekten hinsicht- 
lich ihrer Bedeutung. Als Wissensbasis für Alltagswissen sowie Top-Level 
Ontologie wird dabei Cyc eingesetzt. Über die Ähnlichkeiten zum objekt- 
orientierten Umweltmodell hinaus wird ebenfalls betrachtet, dass Roboter 
in einer offenen Umgebung operieren und hier auch Domänenwissen dy- 
namisch erwerben müssen. Dabei werden neue Definitionen für Konzepte 
in Form von merkmalsbasierten visuellen Beschreibungen gelernt. Dieses 
Vorgehen wird als konzeptuelle Verankerung bezeichnet. Der in [Dao12] 
beschriebene Ansatz ist dabei in der Lage, für eine begriffliche Beschrei- 
bung eines Konzepts entsprechende visuelle Merkmale unter Verwendung 
von Internetressourcen zu erwerben. Diese Merkmale dienen dann zusam- 
men mit dem Begriff als neue Konzeptdefinition und konzeptueller Anker. 
Die Merkmale werden dabei aus Trainingsdaten extrahiert, welche mittels 
Suche im Internet bzgl. des gegebenen Begriffs erworben und anschließend 
vorverarbeitet werden, um z.B. Falschresultate der Suche zu erkennen. Zur 


* Im Sinne von Perceptual Anchoring 
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Extraktion der Merkmale werden anschließend Methoden des maschinel- 
len Sehens eingesetzt. Um gelernte Konzeptbeschreibungen im existieren- 
den Hintergrundwissen Cyc zu integrieren und hierarchisch einzuordnen, 
werden ebenfalls web-basierte Informationen genutzt, welche Begriffe auf 
Identifikatoren der Cyc Top-Level Ontologie abbilden. 


Ein weiterer Ansatz zum Erlernen von Erfahrungswissen für handlungsbe- 
zogene Konzepte wird von Tenorth und Beetz [Ten09] für KnowRob (vgl. 
Abschnitt 2.3.1) vorgestellt. Hierbei wird ein humanoider Roboter betrach- 
tet, welcher in einer Umgebung aufgabenbezogene Handlungen vollführt 
und deren Parameter protokolliert. Dieses Protokoll dient als Datenbasis, um 
neue handlungsbezogene Konzepte als Unterklassen existierender Konzep- 
te ableiten zu können. Dazu müssen im beschriebenen Ansatz einerseits die 
Parameter spezifiziert werden, welche als Beobachtungsdaten in das neue 
Konzept einfließen sollen, und andererseits das Konzept, welches durch eine 
neue Unterklasse spezialisiert werden soll. Als Beispiel wird in [Ten09] der 
Ort genannt, an welchem sich ein Roboter befinden sollte, um bestimmte 
Aufgaben effektiv und effizient erledigen zu können, wie z.B. das Aufneh- 
men von Objekten eines bestimmten Typs. Ein solcher Ort stellt dabei eine 
aufgaben- sowie objekttyp-spezifische Unterklasse eines Konzepts Manipu- 
lationsort dar, welche im Ansatz formal in OWL beschrieben wird. Zum Er- 
lernen dieses Konzepts werden die im Protokoll gespeicherten historischen 
Daten verwendet. Positionsdaten werden dabei zunächst geclustert und mit 
einem Namen symbolisch beschrieben. Anschließend wird für diese und für 
die vorgegebenen Typen von ebenfalls symbolischen Beobachtungsdaten ein 
Entscheidungsbaum für das Zielkonzept trainiert. Die Regeln dieses Ent- 
scheidungsbaums werden schließlich in OWL Beschreibungen zur Defini- 
tion der neuen Unterklasse transformiert. Von Tenorth et al. wird in [Ten11] 
ebenfalls ein Ansatz genannt (vgl. Abschnitt 2.3.1), wie zu einem gegebenen 
Begriff neue visuelle Objektmodelle unter Verwendung von Internetressour- 
cen semi-automatisch erworben werden können. Dieser Ansatz ist in seinem 
Resultat sehr ähnlich zum zuvor vorgestellten Ansatz von Daoutis [Dao12]. 
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2.4.5 Zusammenfassung 


In diesem Abschnitt wurde relevante Literatur mit Bezug auf die adaptive 
Umweltmodellierung fiir offene Welten vorgestellt. Da diese eine spezifische 
Problemstellung innerhalb der objektorientierten Umweltmodellierung ist, 
wurde Literatur aus unterschiedlichen relevanten Bereichen mit Bezug zu 
Teilaufgaben der adaptiven Umweltmodellierung jeweils im Uberblick vor- 
gestellt. Dies betraf u. a. das Erlernen von Konzepten aus Beispieldaten, das 
Erlernen komplexer semantischer Modelle für Ontologien sowie relevante 
Prinzipien aus dem Bereich des menschlichen Konzeptlernens. Weiterhin 
wurden Arbeiten vorgestellt, die eine ähnliche Zielsetzung wie die adaptive 
Umweltmodellierung verfolgen. 


Für die Thematik des Konzeptlernens beschreibt die konzeptuelle Cluster- 
analyse dabei ein grundsätzlich relevantes und ähnliches Vorgehen. In der 
adaptiven Umweltmodellierung muss allerdings zusätzlich die probabilisti- 
sche Informationsrepräsentation von Attributwerten beachtet werden. Auch 
können taxonomische Wissensstrukturen in der objektorientierten Umwelt- 
modellierung nicht rein auf Basis von beobachteten Merkmalen erzeugt wer- 
den. Hier müssen auch ontologische Prinzipien beachtet werden. Der Be- 
reich des Ontologie-Lernens betrifft hauptsächlich zur adaptiven Umwelt- 
modellierung komplementäre semantische Aspekte und kann ergänzend zu 
dieser genutzt werden. Aus dem Bereich der kognitiven Architekturen las- 
sen sich wertvolle Denkanstöße bzgl. Prinzipien der menschlichen Kognition 
ableiten, welche auch für die adaptive Umweltmodellierung Relevanz besit- 
zen. Mit [Dao12] ist weiterhin ein Ansatz gegeben, welcher in Teilen eine 
ähnliche Problemstellung wie die der adaptiven Umweltmodellierung be- 
trachtet, allerdings unter anderen Voraussetzungen. Als ein Treiber für das 
Erlernen neuer Konzeptdefinitionen dient hier die begriffliche Beschreibung 
eines Konzepts, wohingegen in der adaptiven Umweltmodellierung probabi- 
listisch beschriebene Entitätsbeobachtungen als Treiber und Datenbasis des 
Lernens dienen. Der Ansatz in [Ten09] beschreibt weiterhin eine Möglich- 
keit, auf Basis bisheriger Handlungen neues Erfahrungswissen zu erzeugen. 
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2.5 Informationsdarstellung beim 
maschinellen Sehen 


Das Themengebiet des maschinellen Sehens hat eine querschnittliche Rele- 
vanz fiir die objektorientierte Umweltmodellierung und wird daher in einem 
eigenen Abschnitt behandelt. Das maschinelle Sehen beschaftigt sich mit der 
Erkennung von Objekten in z. B. Bild-, Video- oder 3D-Tiefendaten, welche 
über visuelle Sensoren aufgenommen werden. Der betrachtete Frequenzbe- 
reich dieser Sensoren muss dabei nicht notwendigerweise auf den für Men- 
schen sichtbaren Spektralbereich begrenzt sein. Die Erkennung von Objek- 
ten lässt sich unterteilen in die Teilaufgaben der Detektion, Identifikation 
und Klassifikation von Objekten in Sensordaten. Ziel der Detektion ist es, 
diejenigen Datenanteile zu bestimmen, durch welche Objekte repräsentiert 
werden. Dies beinhaltet auch eine Lokalisierung der detektierten Objekte in- 
nerhalb des Referenzsystems der Sensordaten (z.B. in Form von Pixelkoor- 
dinaten). Die Identifizierung beschäftigt sich mit der Wiedererkennung von 
detektierten Objekten auf Basis von Objektmodellen. Diese Objektmodelle 
können entweder a priori modelliert werden oder erst zur Laufzeit erwor- 
ben bzw. gelernt werden. Die Klassifikation hat zum Ziel, detektierte Objekte 
bekannten Klassen zuzuordnen. Diese Objektklassen werden ebenfalls über 
Modelle beschrieben, welche häufig a priori auf Grundlage von Trainings- 
daten eingelernt werden. 


Das Themengebiet des maschinellen Sehens besitzt Überschneidungen mit 
anderen relevanten Themengebieten der Umweltmodellierung. Betroffen 
sind dabei z.B. die Gebiete der Wissensrepräsentation und des Konzeptler- 
nens. Mit der Wissensrepräsentation bestehen Überschneidungen in der Art 
und Weise, wie Modelle von zu erkennenden Objekten bzw. Objektklassen 
dargestellt werden. Beim Konzeptlernen ist die Art und Weise betroffen, wie 
solche Modelle gelernt oder eintrainiert werden. Auf diese beiden Aspekte 
wird in den Abschnitten 2.5.1 und 2.5.2 detaillierter eingegangen. 


Weiterhin besitzt das maschinelle Sehen auch direkte Überschneidungen mit 
der objektorientierten Umweltmodellierung, was die betrachteten Aufgaben 
angeht. So müssen z.B. auch in Umweltmodellen Objekte im Sinne einer 
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Identifikation wiedererkannt werden. In der objektorientierten Umweltmo- 
dellierung werden zu diesem Zweck Verfahren zur Datenassoziation einge- 
setzt. Auch die Klassifikation detektierter Objekte besitzt eine entsprechende 
Aufgabe in der Umweltmodellierung. Dies ist die Zuordnung der Repräsen- 
tanten in der Weltmodell-Komponente zu den Konzepten im Hintergrund- 
wissen. Zu diesem Zweck werden in der objektorientierten Umweltmodellie- 
rung probabilistische Klassifikationsverfahren eingesetzt. Weiterhin ist das 
Erlernen von Modellen für neue Objektklassen relevant für die adaptive Um- 
weltmodellierung. Die adaptive Umweltmodellierung lernt ebenfalls neue 
Klassen für als Repräsentanten im Weltmodell dargestellte Objekte unter 
Anwendung probabilistischer Fusionsverfahren. 


2.5.1 Darstellung von Objektmodellen 


Im Bereich des maschinellen Sehens ist das Hauptanliegen die Erkennung 
von Objekten in Bildern und Videosequenzen. Die meisten Ansätze erfor- 
dern zu diesem Zweck keine Zustandsrepräsentation. Eine Ausnahme sind 
Verfahren, welche zur Unterstützung der Objekterkennung in Videosequen- 
zen eine Verfolgung! dieser Objekte durchführen und dazu Objektpositio- 
nen als Zustand vorhalten. Relevant für die Darstellung von Informationen 
im Bereich des maschinellen Sehens sind die eingesetzten Modelle zur Re- 
präsentation von Objekten und Objektklassen. 


Überblick zu Objektrepräsentationen 


Mit dem Fortschreiten der Forschung haben sich unterschiedlich detaillierte 
Formen der Objektmodellierung ergeben. Einfache geometriebasierte An- 
sätze modellieren Objekte beispielsweise mittels Kanten, Flächen und Ecken 
bzw. in Form einfacher geometrischer Primitive wie Würfeln, Quadern oder 
Kugeln. Darauf aufbauend wurden komplexere Modelle entwickelt, welche 


* Englisch: tracking 
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von ansichtsbasierten Modellen über teilebasierte Modelle bis hin zu merk- 
malsbasierten und hierarchischen Modellen reichen. 


Ansichtsbasierte Ansätze Ansichtsbasierte Ansätze werden häufig zur 
Identifizierung von Objekten eingesetzt. Die Ansätze nutzen vollständige 
Ansichten von Objekten in Bildern als Objektmodelle. Für bekannte Ob- 
jekte werden dabei Datenbanken mit einer Vielzahl von Ansichten pro Ob- 
jekt erstellt, gegen welche ein zu identifizierendes Objekt abgeglichen wird. 
Dieser Abgleich kann direkt auf den Bildinformationen stattfinden. Alterna- 
tiv können zur Effizienzsteigerung auf Basis der Ansichten noch Merkmale 
berechnet werden (z.B. [Mur95]), welche dann zur Identifizierung genutzt 
werden. Unter Verwendung lokaler Merkmale kann weiterhin, gegeben eine 
ausreichend große Menge an unterschiedlichen Objektansichten, ein dreidi- 
mensionales Modell des Objekts erzeugt werden (z.B. [Gor06, Col09]). Die 
lokalen Merkmale werden dabei dazu genutzt, um verschiedene Ansichten 
des Objektes für eine automatisierte Modellerzeugung zueinander in Bezie- 
hung zu setzen. 


Teilebasierte Ansätze Teilebasierte Ansätze (z.B. [Fel00, Fel10, Zha14]) 
beschreiben Objekte als Summe ihrer unterscheidbaren Teile und deren re- 
lativer Positionen zueinander. Zwischen den Objektteilen bestehen dabei 
elastische Verbindungen, so dass eine deformierbare Konfiguration der Tei- 
le ermöglicht wird [Fis73]. Die einzelnen zu erkennenden Objektteile selbst 
können durch unterschiedliche Modelle repräsentiert werden, z. B. über ih- 
re visuelle Erscheinung [Fel00]. Teilebasierte Ansätze besitzen dabei eine 
Ähnlichkeit zu semantischen Modellen, in welchen ebenfalls mittels Teile- 
Ganzes-Beziehungen die Objektteile modelliert werden. Diese beiden Arten 
von Teilemodellen lassen sich auch zu einem integrierten Modell kombinie- 
ren [Lim11]. 


Merkmalsbasierte Ansätze Merkmalsbasierte Ansätze nutzen Mengen 
lokaler, subsymbolischer Merkmale zur Beschreibung von Objekten. Loka- 
le Merkmale beschreiben für Bilddaten dabei beispielsweise die Bildwerte 
in einer nahen Umgebung um ein betrachtetes Pixel auf eine zusammen- 
fassende Weise. Derartige Merkmale korrespondieren im Allgemeinen nicht 
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mit den fiir Menschen intuitiven erscheinungsbezogenen Objekteigenschaf- 
ten (wie Farbe oder Form) und sind somit subsymbolisch. Ein Objektmodell 
stellt dann die einzelnen lokalen Merkmale eines Objekts in Form von De- 
skriptoren dar. Dabei können auch die relativen Positionen solcher Merkma- 
le zueinander repräsentiert werden. Einen vielbeachteten Ansatz für lokale 
Merkmale stellt die von Lowe [Low04] eingeführte skaleninvariante Merk- 
malstransformation (SIFT’ , [Low99]) dar. Diese ermöglicht die Bestimmung 
von rotations- und skalierungsinvarianten Merkmalen für Schlüsselpunkte 
eines Objektabbildes. Zur Modellierung von Objekten (z. B. für eine Identifi- 
kation) werden zunächst deren lokale Merkmale erfasst. Zu jedem Merkmal 
wird dann ein charakteristischer Deskriptor erstellt und samt der relativen 
Position des Merkmals in einer Datenbank gespeichert [Low04]. Eine wei- 
tere wichtige Art von lokalen Merkmalen stellen die von Dalal eingeführ- 
ten Histogramme über Kantenrichtungen (HOG? , [Dal05]) dar. Diese Histo- 
gramme werden für einzelne Regionen eines Bildes berechnet. Sie beschrei- 
ben, wie die Orientierung der in einer Region detektierten Kanten verteilt ist. 


Künstliche neuronale Netze Den aktuellen Stand von Technik und Wis- 
senschaft über alle Teilaufgaben der Objekterkennung stellen künstliche 
neuronale Netze dar. Die nachfolgend betrachteten vorwärtsgerichteten 
neuronalen Netze bestehen dabei aus untereinander verbundenen Schich- 
ten von Neuronen. Eine Eingabeschicht ist für die Entgegennahme der zu 
verarbeitenden Daten (z.B. ein Bild) zuständig. Die Ergebnisse der Ver- 
arbeitung (z.B. die Klassifikation der Objekte im Bild) werden von einer 
Ausgabeschicht dargestellt. Verbunden werden Ein- und Ausgabeschicht 
über sog. versteckte Schichten. Die Verbindungen zwischen den Neuronen 
der unterschiedlichen Schichten können über Gewichte parametriert wer- 
den. Die Gewichte stellen dabei die wesentlichen Parameter von trainierten 
Modellen dar. Ein für das maschinelle Sehen besonders wichtiger Typ von 
vorwärtsgerichteten neuralen Netzen ist durch die faltenden neuronalen 
Netze (CNNs*) von LeCun [LeC98] gegeben. Faltende neuronale Netze 


* Englisch: scale-invariant feature transform 
? Englisch: histogram of oriented gradients 
® Englisch: convolutional neural networks 
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orientieren sich in ihrem Aufbau an Prinzipien, welche von der Physiologie 
des menschlichen Sehens inspiriert sind. Speziell zusammen mit modernen 
tiefen Architekturen (sog. „Deep Learning“) sind faltende neuronale Netze 
sehr erfolgreich im Bereich der Objektdetektion und -klassifikation (vgl. 
z.B. [Gir14, Sze14, Gir15, Ren15, He16, Red17]). 


Neuronale Netze besitzen gegenüber anderen Ansätzen der Objekterken- 
nung einen wichtigen Unterschied. Dies betrifft die Art und Weise, wie die 
zur Erkennung verwendeten Merkmale ausgewählt werden. Werden diese 
Merkmale bei anderen Ansätze oft a priori manuell erstellt und ausgewählt, 
so erlernen neuronale Netze ihre Merkmale selbsttätig in ihrer Trainings- 
phase. Diese Tatsache ist auch für die Informationsdarstellung in neurona- 
len Netzen relevant. In vorwärtsgerichteten neuronalen Netzen ergeben sich 
die Modelle für Objektklassen in Form einer hierarchischen, verteilten Dar- 
stellung. Ein Modell zur Repräsentation einer bestimmten Objektklasse liegt 
dabei verteilt innerhalb des neuronalen Netzes vor. Es wird durch die unter- 
schiedlichen Gewichte der Verbindungen zwischen den Schichten repräsen- 
tiert. Eine Objektklasse wird durch die geschichtete Architektur somit auf 
unterschiedlichen Abstraktionsniveaus repräsentiert. Die unteren, eingabe- 
nahen Schichten eines Netzes stellen dabei oft subsymbolische Merkmale 
dar. Diese werden auf darüber liegenden Schichten zu immer komplexeren 
Merkmalen (für Bilddaten können dies z.B. Kanten, Linienzüge, Teilkontu- 
ren usw. sein) zusammengesetzt. Manchen dieser komplexeren Merkmale 
kann dabei eine begriffliche Bedeutung zugeordnet werden. Die Darstel- 
lung von Objektmodellen erfolgt weiterhin geteilt in dem Sinne, dass sich 
die Repräsentationen verschiedener Objektklassen die Merkmale der unte- 
ren Schichten eines Netzes teilen [LeC15]. Erst auf den darüber liegenden 
Schichten werden diese Merkmale dann unterschiedlich kombiniert zur Un- 
terscheidung der Objektklassen. 


Attributbasierte Objektrepräsentation 


Im Bereich der Umweltmodellierung, vor allem für die Zustandsrepräsenta- 
tion, ist die Darstellung von Objekten mittels semantisch interpretierbaren, 
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d.h. für einen Menschen verständlichen Attributen wichtig. Auch für die 
Objekterkennung, vor allem im Bereich der Servicerobotik, gewinnt dieser 
Ansatz aufgrund seiner Möglichkeiten zunehmend an Bedeutung [Sun13, 
Bal15]. Beispiele für attributbasierte Objektrepräsentationen sind die grund- 
legenden Ansätze von Farhadi [Far09] und Lampert [Lam09], der Ansatz zur 
Objektidentifikation durch visuelle Attribute und sprachliche Begriffe von 
Sun [Sun13] sowie die Repräsentation mittels relativer Attribute von Parikh 
[Par11]. 


Vorteile der attributbasierten Objektrepräsentation Die attributbasier- 
ten Ansätze zur Objektrepräsentation bieten einige Vorteile. Zunächst er- 
möglichen sie es, Objekte und Objektklassen durch relativ einfache Modelle 
zu beschreiben, beispielsweise als Liste aus charakteristischen Attributen. 
Diese Attribute sind in vielen Ansätzen semantisch interpretierbar (z.B. die 
Farbe oder Form von Objekten [Lam09, Sun13]), was eine enge Kopplung 
mit sprachlichen Beschreibungen von Objekten ermöglicht. Der Ansatz von 
Farhadi [Far09] erlaubt es beispielsweise, die aus Bildmaterial über Objek- 
te gewonnenen Informationen sprachlich wiederzugeben. Weiterhin ist es 
möglich, für klassifizierte Objekte ungewöhnliche Objekteigenschaften auf- 
zuzählen, welche im Bildmaterial entdeckt wurden. Auch die Verwendung 
relativer Attribute im Ansatz von Parikh [Par11], bei welchem Attributwer- 
te als Vergleich zu Eigenschaften bekannter Objekte dargestellt werden, er- 
laubt es, eine vergleichende sprachliche Beschreibung für unbekannte Ob- 
jekte zu erzeugen. Die allgemeine Möglichkeit, detaillierte Informationen 
über betrachtete Objekte auf einer semantischen Ebene bereitstellen zu kön- 
nen, ist auch in Bezug auf eine natürlichsprachliche Kommunikation mit den 
Nutzern eines kognitiven Systems von Vorteil [Bal15]. 


Attribute als Zwischenschicht der Objektrepräsentation 


Begründet liegen die mehrfachen neuen Möglichkeiten attributbasierter An- 
sätze in der Tatsache, dass durch die Beschreibung von Objekten mittels 
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Attributen eine neue Zwischenschicht der Informationsrepräsentation zwi- 
schen Merkmalen auf der einen Seite und Symbolen für Objekt- bzw. Klas- 
sennamen auf der anderen Seite eingebracht wird. Dies bedeutet einerseits, 
dass sowohl Objekte als auch Objektklassen nun auf Basis der definierten 
Attribute modelliert werden können, was die bereits angesprochene Ver- 
einfachung ihrer Modellierung aufgrund der Abstraktion von Merkmalen 
ermöglicht. Oft ist eine Liste von Attributen als Objektmodell ausreichend. 
Die einzelnen Attribute werden dabei häufig für die weitere Verarbeitung als 
stochastisch unabhängig angenommen (z. B. [Lam09, Sun13]), gegeben bild- 
hafte Evidenz. Andererseits müssen nun die Attribute ihrerseits auf Basis 
von Objektmerkmalen definiert werden, um ihre Fundierung z.B. in Bild- 
informationen zu erreichen. Eine besondere Schwierigkeit im Vergleich zu 
ansichts- oder merkmalsbasierten Ansätzen ist dabei das Problem, dass At- 
tribute unabhängig von den betrachteten Objektlassen definiert werden soll- 
ten. Dies erhöht die Nützlichkeit der einzelnen Attribute und reduziert we- 
sentlich den Aufwand, der zur Definition oder zum Training der Modelle 
notwendig ist. 


Geläufige Attribute und zugrunde liegende Merkmale 


Als Attribute zur Beschreibung einzelner Objekte sowie von Objektklas- 
sen nutzen die attributbasierten Ansätze Eigenschaften wie die Farbe, 
Form, Größe, Textur oder das Material zu beschreibender Objekte (z.B. 
[Far09, Lam09, Sun13]). Weiterhin beziehen sie das Vorhandensein von 
charakteristischen Objektteilen mit ein. Zur Bestimmung dieser Attribute 
können ansichtsbasierte Verfahren auf Bildregionen oder lokale Merkmale 
genutzt werden, z.B. in Verbindung mit Bildpyramiden, sowie geometrische 
Merkmale. Als Ausgangsdaten werden Farbbilder und RGB-D Daten ver- 
wendet, welche Farbbilder pro Pixel mit zusätzlichen Tiefeninformationen 
anreichern. 
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2.5.2 Lernen von Modellen für Objektklassen 


In Bezug auf das Konzeptlernen in der adaptiven Umweltmodellierung ist 
auch das Erlernen neuer Objektklassen beim maschinellen Sehen ein rele- 
vantes Thema. Dabei sind hauptsächlich Ansätze betroffen, die eine Klassi- 
fikation von Objekten ermöglichen. Viele dieser Verfahren dienen zugleich 
auch der Detektion von Objekten. Für die Objektidentifikation werden da- 
gegen Modelle konkreter Objekte genutzt, nicht allgemeiner Klassen, daher 
sind entsprechende Ansätze an dieser Stelle weniger relevant. 


Merkmalsbasierte Ansätze Viele der zuvor genannten Ansätze erlernen 
Modelle für Objektklassen a priori zur Entwurfszeit eines Systems. Zur 
Laufzeit werden die Verfahren dann nur zur Vorhersage der Klasse von be- 
trachteten Objekten genutzt. Das Training kann dabei stufenweise erfolgen. 
Sind die zu verwendenden Merkmale vorgegeben, so können Werte für diese 
Merkmale aus Trainingsdaten (z. B. Bildern) extrahiert und zu Deskriptoren 
zusammengefasst werden. Auf solchen Deskriptoren können dann Klassi- 
fikationsverfahren trainiert werden. Diese Klassifikationsverfahren lernen 
dabei beispielsweise die Objekte einer Klasse von den Objekten der restli- 
chen betrachteten Klassen zu unterscheiden. Die gelernten Parameter der 
Klassifikationsverfahren stellen hier das Modell der Objektklasse dar. Zu- 
sätzlich können die extrahierten Merkmale zunächst vorverarbeitet werden. 
Zu diesem Zweck kann eine Ballungsanalyse’ erfolgen, welche die Merk- 
male zu Gruppen zusammenfasst. Eine derartige Zusammenfassung kann 
die Generalisierungsfähigkeit des nachgelagerten Klassifikationsverfahrens 
erhöhen. Weiterhin kann als Vorverarbeitung eine Merkmalsselektion er- 
folgen. Auf diese Weise ist es möglich, nur die aussagekräftigsten Merkmale 
zum Training eines Klassifikationsverfahrens zu verwenden. Dies kann zu 
einer Verbesserung der Erkennungsleistung führen. Je nach Komplexität 
des Modells und der Menge der verfügbaren Trainingsdaten kann ein 
Lernvorgang zeitintensiv sein. Die Komplexität eines zu lernenden Modells, 
gemessen z.B. über die Anzahl der festzulegenden Parameter, bestimmt 


* Englisch: clustering 
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weiterhin die Menge an Trainingsdaten, die benötigt wird, um ein Modell 
mit einer gewünschten Erkennungsleistung trainieren zu können. 


Das Training der Modelle von neuronalen Netzen erfolgt in einem ganzheit- 
lichen Ansatz. Dabei wird nicht nur das Klassifikationsverfahren für gege- 
bene Objektklassen trainiert, sondern zugleich auch die zu verwendenden 
Merkmale. Dies ist in der hierarchischen Repräsentation neuronaler Netze 
begründet. Auf diese Weise erhöht sich im Vergleich zu anderen Ansätzen 
die Anzahl der festzulegenden Parameter und somit die Komplexität der zu 
erlernenden Modelle. Dies bedingt eine ebenfalls erhöhte Anzahl an Trai- 
ningsdaten sowie einen erhöhten Zeitaufwand zur Durchführung des Trai- 
nings. Für komplexere Modelle können dabei Millionen von Trainingsda- 
ten benötigt werden [He16]. Auch die Trainingszeit für neuronale Netze 
kann, abhängig von der verfügbaren Hardware und Rechenleistung, Tage 
oder sogar Wochen betragen [Sze14]. Eine adaptive Anpassung an neue Ob- 
jektklassen zur Laufzeit eines Systems ist für merkmalsbasierte Ansätze im 
Allgemeinen nicht vorgesehen. Allerdings kann durch Konzepte wie Trans- 
ferlernen und unter Ausnutzung der Tatsache, dass in neuronalen Netzen 
die unteren Schichten oftmals objektunabhängige Merkmale darstellen, ei- 
ne Reduktion der benötigten Trainingszeit und -daten erreicht werden. 


Attributbasierte Ansätze Sowohl von Farhadi [Far09] als auch von 
Lampert [Lam09] wird die Möglichkeit beschrieben, Modelle für neue 
Objektklassen im Fall einer attributbasierten Objektrepräsentation rein 
auf der Grundlage von natürlichsprachlichen Beschreibungen zu erlernen. 
Dieses Vorgehen wird möglich, wenn die zur Beschreibung von Objekten 
verwendeten Attribute einerseits unabhängig von einzelnen Objektklassen 
definiert sind und somit einen Transfer gelernten Wissens auf neue Klassen 
ermöglichen, und andererseits mit natürlichsprachlichen beschreibbaren 
Objekteigenschaften korrespondieren. Auch bei der Objektrepräsentation 
durch relative Attribute von Parikh [Parl1] ist es möglich, unbekannte 
Objektklassen aufgrund einer vergleichenden Beschreibung der Attribute 
der Objektklasse gegenüber den Attributen bekannter Objektklassen zu 
erlernen. Weiterhin wird gezeigt, dass eine attributbasierte Objektreprä- 
sentation auch beim Erlernen von Modellen für neue Objektklassen aus 
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Trainingsbildern vorteilhaft ist - hier wird eine Reduktion der Trainings- 
daten erméglicht. 


2.5.3 Zusammenfassung zum maschinellen Sehen 


Das Themengebiet des maschinellen Sehens ist aufgrund unterschiedlicher 
Aspekte relevant für die objektorientierte Umweltmodellierung. Zunächst 
können Verfahren des maschinellen Sehens zur vorgelagerten Sensordaten- 
verarbeitung in der Umweltmodellierung eingesetzt werden. Dazu können 
Objekte in Bildern detektiert werden und für diese Objekte die Werte ge- 
wünschter Attribute bestimmt werden. Das Ergebnis dieser Verarbeitung 
kann dann an das objektorientierte Umweltmodell übergeben werden. Hier- 
bei sind nach den Prinzipien der objektorientierten Umweltmodellierung vor 
allem attributbasierte Verfahren des maschinellen Sehens von Interesse. 


Weiterhin werden beim maschinellen Sehen Aufgaben gelöst, die grundsätz- 
lich auch in der objektorientierten Umweltmodellierung anfallen, wenn auch 
in abgewandelter Form. Dies betrifft die Identifikation von beobachteten Ob- 
jekten sowie deren Klassifikation. Verfahren des maschinellen Sehens, vor 
allem tiefe neuronale Netze, stellen dabei den Stand von Wissenschaft und 
Technik für diese Aufgaben dar. In der objektorientierten Umweltmodellie- 
rung steht die sensorische Erfassung von Objekten allerdings nicht im Vor- 
dergrund. Der zentrale Aspekt der Umweltmodellierung ist die schritthal- 
tende semantische Repräsentation eines Umgebungszustandes. Diese dient 
als Ausgangsbasis für Entscheidungen und zur Planung von z.B. Handlun- 
gen in autonomen kognitiven Systemen. Erkannte Objekte stellen hierbei 
die notwendigen Eingabedaten dar. 


Für die adaptive Umweltmodellierung sind Verfahren des maschinellen Se- 
hens interessant, welche zur Laufzeit eines Systems neue Modelle für Ob- 
jektklassen erlernen können. In diesem Bereich sind vor allem wieder at- 
tributbasierte Verfahren relevant. Die Verwendung von Attributen als eine 
Zwischenschicht zur Informationsrepräsentation ermöglicht es dabei, neue 
Objektklassen mit einer deutlich reduzierten Menge von Trainingsdaten zu 
erwerben. Für die adaptive Umweltmodellierung liegt ebenfalls eine solche 
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Aufgabenstellung vor, bei welcher zur Laufzeit eines Systems auf Basis ei- 
ner relativ geringen Menge von Trainingsdaten neue Konzepte gelernt wer- 
den sollen. Die datenintensiven Verfahren des maschinellen Sehens, wie tiefe 
neuronale Netze, sind an dieser Stelle weniger geeignet. 


2.6 Zusammenfassung 


In diesem Kapitel wurde die fiir diese Arbeit relevante Literatur vorgestellt. 
Aufgrund der querschnittlichen Natur der betrachteten Thematik wurde da- 
bei der Stand der Wissenschaft und Technik in unterschiedlichen Themenge- 
bieten betrachtet und im Uberblick sowie mit Bezug zur adaptiven Umwelt- 
modellierung dargestellt. Als grundlegende Themengebiete waren die Wis- 
sensmodellierung und -repräsentation, die probabilistische Informationsver- 
arbeitung sowie das Konzeptlernen betroffen. Aufgrund der Unterschied- 
lichkeit dieser Themengebiete wurden diese jeweils individuell zusammen- 
gefasst und in ihrer Relevanz fiir diese Arbeit bewertet. Daher wird an dieser 
Stelle auf eine weitergehende Zusammenfassung verzichtet. 
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In dieser Arbeit wird eine adaptive Umweltmodellierung fiir kognitive Syste- 
me als Erweiterung der objektorientierten Umweltmodellierung betrachtet. 
Dieses Kapitel gibt einen Überblick über die adaptive Umweltmodellierung 
und stellt zugleich dar, wie sich die nachfolgenden Kapitel in den Ansatz 
der adaptiven Umweltmodellierung einfügen. Weiterhin werden allgemeine 
Grundlagen der objektorientierten Umweltmodellierung eingeführt. Spezifi- 
sche Aspekte der Umweltmodellierung werden je nach Bedarf direkt in den 
späteren Kapiteln dargestellt. 


3.1 Grundlagen der Umweltmodellierung 


Das objektorientierte Umweltmodell stellt die Ausgangsbasis für diese Ar- 
beit dar, auf welcher die adaptive Umweltmodellierung aufbaut. In der Um- 
weltmodellierung wird die von einem technisch kognitiven System beob- 
achtete Umgebung repräsentiert. Als Umgebung wird dabei ein raumzeitli- 
cher Ausschnitt einer gegebenen Anwendungsdomäne auf einem festgeleg- 
ten Abstraktionsniveau betrachtet [Bel12c]. In diesem raumzeitlichen Aus- 
schnitt werden mittels Sensoren Entitäten beobachtet. Häufig entsprechen 
diese Entitäten anfassbaren Objekten. Es können allerdings auch Abstrakta 
betroffen sein, wie z.B. Ereignisse oder Situationen einer Anwendungsdo- 


mäne. 


Durch Umweltmodellierung wird eine abstrakte Repräsentation der betrach- 
teten Umgebung erzeugt, z.B. in Form eines Modells [Kuw10]. Ein Modell 
stellt einen Sachverhalt auf eine vereinfachte, aber strukturierte Weise dar. 
Auch die Umweltmodellierung hat zum Ziel, die beobachtete Umgebung und 
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ihren Zustand abstrahiert zu erfassen und durch Verbindung mit einem se- 
mantischen Wissensmodell strukturiert darzustellen. Zu diesem Zweck wird 
das objektorientierte Umweltmodell eingesetzt. Dieses wurde urspriinglich 
von Beyerer [Bey07] vorgeschlagen und zusammen von Gheta, Heizmann, 
Bauer, Belkin und Emter ([Emt08, Ghe08, Bau09, Hei10, Ghe10b]) weiter aus- 
gearbeitet und umgesetzt. Das objektorientierte Umweltmodell besteht, wie 
bereits in Abbildung 1.1 dargestellt, aus zwei Anteilen: einer Weltmodell- 
Komponente und einem Hintergrundwissensmodell. 


In der Weltmodell-Komponente erfolgt die schritthaltende Repräsentation 
des beobachteten Umgebungszustandes. Für jede in der Umgebung beob- 
achtete Entität wird dabei ein sog. Repräsentant im Weltmodell angelegt 
[Bel12c]. Die für Entitäten beobachteten Eigenschaften und Merkmale wer- 
den als Attribute der Repräsentanten dargestellt und probabilistisch über 
Wahrscheinlichkeitsverteilungen beschrieben. Die einzelnen Attribute der 
Repräsentanten werden dabei als stochastisch unabhängig angenommen 
[Bau09]. Um ebenfalls die Beziehungen, welche zwischen repräsentierten 
Entitäten in der Umgebung bestehen, modellieren zu können, können auch 
Repräsentanten untereinander über Relationen verknüpft werden. Die im 
Weltmodell erfassten Informationen werden schritthaltend mit Umgebungs- 
beobachtungen aktualisiert. Dabei unterliegen sie einer probabilistischen 
Informationsverwaltung und -verarbeitung. Der aktuelle, im Weltmodell 
repräsentierte Umgebungszustand spielt auch für die adaptive Umweltmo- 
dellierung eine wichtige Rolle, z. B. in Bezug auf die Bewertung der Eignung 
eines Hintergrundwissensmodells. Kapitel 5 dieser Arbeit geht daher auf 
die Informationsverwaltung im objektorientierten Umweltmodell ein. 


Die Strukturierung der erworbenen Informationen erfolgt unter Verwen- 
dung eines semantischen Hintergrundwissensmodells. Begrifflich werden in 
dieser Arbeit Informationen von Wissen unterschieden, jedoch ohne eine 
allzu scharfe Abgrenzung zwischen den beiden Begriffen zu definieren. In- 
formationen stellen dabei interpretierte und ggf. verknüpfte Sensordaten dar 
[Das08], wie sie z. B. im Weltmodell abgelegt und fusioniert werden. Ein Wis- 
sensmodell beinhaltet in dieser Arbeit dagegen höherwertige, konsolidierte, 
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verknüpfte, ggf. nicht direkt beobachtbare und formal beschriebene Sachver- 
halte in Bezug auf eine betrachtete Anwendungsdomäne. Solches Wissen ist 
in der Umweltmodellierung als Vorwissen gegeben, welches bereits zur Ent- 
wurfszeit eines kognitiven Systems z. B. von Domänenexperten ausgewählt, 
aufbereitet und formal modelliert wird. Ein Hintergrundwissensmodell stellt 
solches Vorwissen formal und in einer für das objektorientierte Umweltmo- 
dell verarbeitbaren Form dar. 


Das in einem Hintergrundwissensmodell gegebene Vorwissen wird in der 
objektorientierten Umweltmodellierung verwendet, um die beobachteten 
Informationen im Weltmodell ergänzen, verknüpfen und vervollständigen 
zu können. Dabei wird auch die Semantik von relevanten Typen von Objek- 
ten im Hintergrundwissen dargestellt. So kann z.B. die aufgabenbezogene 
Bedeutung oder der Zweck einer Entität im Hintergrundwissen model- 
liert sein und dem kognitiven System bei Bedarf genannt werden. Auch 
Informationen, welche nicht durch Umgebungsbeobachtungen erwerb- 
bar sind, können im Hintergrundwissensmodell abgelegt werden und zur 
Vervollständigung der Repräsentanten des Weltmodells genutzt werden. 


Entitäten bzw. genauer Typen von Entitäten werden im Hintergrundwis- 
sensmodell dabei über sog. Konzepte modelliert. Ein Konzept wird, analog 
zu Repräsentanten, ebenfalls durch Attribute beschrieben, deren Werte pro- 
babilistisch mittels Wahrscheinlichkeitsverteilungen dargestellt sind. 


3.2 Adaptive Umweltmodellierung 


Das Hintergrundwissen eines objektorientierten Umweltmodells wird zur 
Entwurfszeit eines kognitiven Systems von menschlichen Domänenexper- 
ten a priori festgelegt. Ein Hintergrundwissensmodell beschreibt somit alle 
Entitäten, die zur Entwurfszeit als relevant für den Betrieb eines kognitiven 
Systems betrachtet wurden. 


Dabei kann aber immer nur ein abgeschlossener Teil der Anwendungsdo- 
mäne repräsentiert werden. Es gibt Anwendungsfälle, in welchen ein solch 
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abgeschlossenes Hintergrundwissensmodell ausreichend ist. Viele relevan- 
te Anwendungsdomanen von technisch kognitiven Systemen besitzen al- 
lerdings eine inhärente Komplexität, die eine vollständige manuelle Model- 
lierung einer Domäne schwierig und sehr zeitaufwendig macht. In solchen 
Fällen muss in der Umweltmodellierung davon ausgegangen werden, dass 
ein Hintergrundwissensmodell per se eine Approximation darstellt und po- 
tentiell unvollständig ist. In realistischen Anwendungsdomänen kann z.B. 
bereits für begrenzte Anwendungsfälle die Anzahl der zu modellierenden 
Entitätstypen schnell sehr groß werden. Zusätzlich zeichnen sich Anwen- 
dungsfälle, in welchen menschliche Interaktion gegeben ist, oftmals durch 
eine hohe Dynamik aus. Diese Dynamik kann dazu führen, dass das kogni- 
tive System unerwartet auf Entitäten trifft, welche während der Erstellung 
des Domänenmodells nicht betrachtet wurden. Ein a priori erstelltes Hin- 
tergrundwissensmodell mit einer festen Menge von Konzepten kann somit 
nicht mehr ausreichend sein, um seine Aufgaben zu erfüllen. 


Das objektorientierte Umweltmodell ist als zentrale Informationsdrehschei- 
be für kognitive Systeme entworfen. Daher sollte es auch in der Lage sein, 
mit Situationen umzugehen, in denen nicht modellierte Entitäten auftreten. 
Im Speziellen sollte es dem Umweltmodell möglich sein, das Vorliegen derar- 
tiger Situationen zu erkennen und die Situationen bewerten zu können. Wei- 
terhin sollte es möglich sein, auch mit solchen Entitäten umgehen zu kön- 
nen, für welche im Hintergrundwissensmodell bisher keine Konzepte ent- 
halten sind, zumindest falls dies die vorliegende Situation oder allgemein der 
Anwendungsfall erfordert. Der Besitz der genannten Fähigkeiten ermöglicht 
es einem Umweltmodell, auch in einer offenen Welt weiterhin angemessen 
funktionieren und dabei adaptiv auf unvorhergesehene Situationen reagie- 
ren zu können. Die durch die genannten Fähigkeiten beschriebenen Auf- 
gaben und Tätigkeiten stellen einen Kerngegenstand dieser Arbeit dar und 
werden unter dem Begriff der adaptiven Umweltmodellierung zusammenge- 
fasst. Die Frage, unter welchen grundsätzlichen Annahmen und Prinzipien 
eine solche adaptive Umweltmodellierung durchgeführt werden kann und 
sollte, wird im folgenden Abschnitt dargestellt. In Abschnitt 3.2.2 werden 
dann die einzelnen Teilaufgaben dargelegt, die sich unter diesen Prinzipien 
für eine adaptive Umweltmodellierung ergeben. 
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3.2.1 Prinzipien für eine adaptive Umweltmodellierung 


Die adaptive Umweltmodellierung betrifft primar die Verwaltung des 
Hintergrundwissensmodells. Eine mögliche Anpassung des Hintergrund- 
wissens findet jedoch immer adaptiv in Bezug auf den im Weltmodell 
repräsentierten Umgebungszustand statt. Somit spielt auch das Weltmodell, 
dessen aktuelle Inhalte sowie allgemein die Art und Weise der Informations- 
repräsentation im Weltmodell eine Rolle für die adaptive Umweltmodellie- 
rung. Weiterhin ist das objektorientierte Umweltmodell zur Anwendung in 
technisch kognitiven Systemen entworfen. Daher spielen auch Aspekte der 
menschlichen Kognition eine gewisse Rolle für die Informationsverarbei- 
tung im objektorientierten Umweltmodell. Die Betrachtung solcher Aspekte 
kann somit auch für die adaptive Umweltmodellierung hilfreich sein, z.B. 
als motivierender Denkanstoß oder zur Festlegung einer Grundrichtung. 
Ein ähnliches Vorgehen findet sich z.B. auch beim Entwurf von kognitiven 
Architekturen im Bereich der Kognitionswissenschaften. Innerhalb dieses 
groben Rahmens folgt die in dieser Arbeit entworfene adaptive Umwelt- 
modellierung gewissen Grundprinzipien, welche nachfolgend im Detail 
dargelegt werden. Diese Prinzipien wurden u.a. in [Kuw16] vorgestellt. 


Wie bereits einleitend erwähnt, soll eine Anpassung des Hintergrundwis- 
sensmodells vor allem bedarfsgerecht erfolgen. Ein Hintergrundwissensmo- 
dell dient in der objektorientierten Umweltmodellierung hauptsächlich da- 
zu, semantisches Vorwissen für die im Weltmodell enthaltenen Repräsen- 
tanten bereitzustellen. Der Bedarf für eine Anpassung des Hintergrundwis- 
sensmodells definiert sich somit vor allem in Bezug auf die aktuellen Inhalte 
des Weltmodells. Ist ein eingesetztes Hintergrundwissensmodell nicht in der 
Lage, für alle im Weltmodell enthaltenen Repräsentanten Vorwissen bereit- 
zustellen, so besteht der Bedarf für eine Anpassung dieses Hintergrundwis- 
sensmodells. Eine Anpassung erfolgt dabei als eine Adaption an Teile des im 
Weltmodell dargestellten Umgebungszustandes. 


Das Prinzip einer bedarfsgerechten Anpassung betrifft allgemein die Frage- 
stellung, wann bzw. unter welchen Umständen eine Anpassung stattfinden 
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soll. Eine weitere wichtige Fragestellung betrifft den Aspekt, welche der In- 
formationen im Weltmodell die Grundlage einer solchen Anpassung darstel- 
len sollen. Hierbei spielt in dieser Arbeit das Prinzip der Relevanz eine wich- 
tige Rolle. Die zugrunde liegende Frage ist dabei, welche der im Weltmodell 
enthaltenen Informationen tiber die Gegebenheiten der betrachteten Umge- 
bung relevant genug sind, um im Falle eines festgestellten Anderungsbedarfs 
als Grundlage einer solchen Anpassung zu dienen. Anpassungen in einem 
Hintergrundwissensmodell werden in der adaptiven Umweltmodellierung 
durch das Erlernen neuer bzw. angepasster Konzepte umgesetzt. Dass Re- 
levanz beim Erlernen neuer Konzepte ein wichtiges Prinzip darstellt, lasst 
sich auch durch eine Analogie zum menschlichen Lernen motivieren. Hier 
kann die Relevanz ebenfalls ein wichtiges Selektionskriterium fiir das zu Er- 
lernende darstellen [Hen12]. 


Eine weitere Fragestellung, neben den Fragen nach dem Wann und der Da- 
tengrundlage des Lernens, betrifft das Wie einer Modellanpassung. Im Be- 
reich der statistischen Modellierung werden sog. Informationskriterien zur 
Bewertung der Güte von Modellen genutzt [Kon08]. Eines der Prinzipien 
dieser Informationskriterien ist es, einen Ausgleich zwischen der Komplexi- 
tät eines Modells und seiner Fähigkeit, gegebene Daten darstellen zu kön- 
nen, anzustreben. Modelle, welche einen solchen Ausgleich erreichen, wer- 
den dabei gegenüber anderen Modellen bevorzugt. Unter Anwendung dieses 
Prinzips lässt sich bereits oft die Überanpassung eines Modells an gegebene 
Daten verhindern und so dessen Generalisierungsfähigkeit verbessern. 


Insgesamt sollen Anpassungen an einem Hintergrundwissensmodell auf ei- 
ne für den Menschen nachvollziehbare Art und Weise erfolgen. Nachvoll- 
ziehbarkeit betrifft dabei z.B. die Gründe, warum die Anpassung eines Mo- 
dells stattfindet, die Datengrundlage dieser Anpassung, die Art, auf welche 
eine konkrete Anpassung durchgeführt wird sowie deren konkrete Ände- 
rungen an einem Modell. Weiterhin kann es auch relevant sein darzustellen, 
welche Auswirkungen die durchgeführten Änderungen haben, z.B. in Be- 
zug auf die Aufgaben, für welche das Modell genutzt wird. Um eine bessere 
Nachvollziehbarkeit von Modellanpassungen zu ermöglichen, sollten diese 
möglichst anhand eines strukturierten Vorgehens durchgeführt werden. 
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Schließlich sollten sich auch die für eine adaptive Umweltmodellierung 
genutzten Methoden zur Modellanpassung am grundsätzlichen Prinzip der 
probabilistischen Informationsverwaltung im Umweltmodell orientieren. 


3.2.2 Aufgaben der adaptiven Umweltmodellierung 


Die adaptive Umweltmodellierung hat in dieser Arbeit das Ziel, dem objekt- 
orientierten Umweltmodell den Umgang mit Situationen zu ermöglichen, in 
welchen unvorhergesehene Entitäten auftreten. Dies betrifft Entitäten, für 
deren Typ im Hintergrundwissensmodell kein Konzept hinterlegt ist. 


Eine erste Aufgabe stellt somit das Detektieren solcher Situationen dar. Dies 
kann auf zwei Ebenen erfolgen. Auf einer globalen Ebene ist die Qualität des 
Gesamtmodells betroffen. Diese Modellqualität bzw. Modellgüte beschreibt 
dabei, wie gut ein Hintergrundwissensmodell geeignet ist, die im Weltmodell 
dargestellten Repräsentanten beschreiben bzw. erklären zu können. Je weni- 
ger gut ein Hintergrundwissensmodell dazu in der Lage ist, je schlechter also 
seine Modellgüte ist, desto geringer ist auch sein Nutzen für die objektorien- 
tierte Umweltmodellierung. Die Modellgüte stellt daher ein übergeordnetes 
Kriterium zur Bewertung eines Hintergrundwissensmodells dar. In Teilen 
stellt die Modellgüte somit zugleich auch ein Kriterium für die Einsetzbarkeit 
des objektorientierten Umweltmodells als ein semantisches Umweltmodell 
dar. Die Problemstellung der gesamthaften Bewertung eines Hintergrund- 
wissensmodells bzgl. seiner Güte wird im Rahmen der sog. quantitativen 
Modellbewertung in Kapitel 7 betrachtet. 


Neben einer Betrachtung auf globaler Ebene kann auch auf lokaler Ebene 
das Vorliegen von nicht durch das Hintergrundwissensmodell erklärten Re- 
präsentanten detektiert werden. Dabei stehen einzelne Repräsentanten im 
Vordergrund. Ziel dieser lokalen Betrachtungen ist es, diejenigen Repräsen- 
tanten zu identifizieren, welche nur schlecht durch die Konzepte des Hinter- 
grundwissens beschrieben und erklärt werden können. Für diese Aufgabe 
können lokale Detektionsmaße bzgl. solcher schlecht beschriebener Reprä- 
sentanten definiert und eingesetzt werden. In dieser Arbeit erfolgt dies im 
Rahmen der adaptiven Wissensverwaltung, welche Kapitel 8 vorstellt. 
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Die adaptive Wissensverwaltung fasst all diejenigen Aufgaben zusammen, 
welche sich mit konkreten Anpassungs- und Verbesserungsmaßnahmen für 
ein als unzureichend bewertetes Hintergrundwissensmodell beschäftigten. 
Die quantitative Modellbewertung dient dabei als ein übergeordnetes Maß 
zur Steuerung dieser Wissensverwaltung. Neben der reinen Detektion des 
Auftretens von schlecht beschriebenen Repräsentanten auf lokaler Ebene 
müssen solche Repräsentanten auch im Sinne einer Buchhaltung verwaltet 
werden. Dies ist eine Voraussetzung zur Umsetzung des Prinzips der Rele- 
vanz von Modellanpassungen. Diese Verwaltung sorgt dafür, dass für eine 
durchzuführende Modellanpassung eine entsprechende Menge von relevan- 
ten Lernbeispielen als Datengrundlage zur Verfügung steht. Diese Lernbei- 
spiele werden dabei aus denjenigen Repräsentanten ausgewählt, welche als 
schlecht beschrieben identifiziert wurden. 


Schließlich müssen Modellanpassungen durchgeführt werden. Diese Aufga- 
be ist ebenfalls ein Teil der adaptiven Wissensverwaltung. Auch diese Mo- 
dellanpassungen können und sollen von einer Modellgütebewertung geleitet 
werden. Modellanpassungen betreffen dabei das Erlernen neuer oder ange- 
passter Konzepte aus den als Lernbeispielen bereitgestellten Repräsentanten 
und die Einordnung dieser Konzepte im Hintergrundwissensmodell. 


Um neue Konzepte lernen und in ein Hintergrundwissensmodell einordnen 
zu können, muss ein solches Modell klar strukturiert sein und definierten 
Modellierungsprinzipien folgen. Dabei muss auch formal beschrieben wer- 
den, auf welche Weise Konzepte und ihre probabilistischen Attribute in der 
objektorientierten Umweltmodellierung repräsentiert werden. Auch müs- 
sen Festlegungen getroffen werden, wie welche Arten von Attributen un- 
terschieden werden und was deren Bedeutung in der Umweltmodellierung 
ist oder auf welche Weise Wissen grundsätzlich in einem Wissensmodell 
strukturiert wird. Diesem Thema widmet sich Kapitel 4, in welchem ein Me- 
tamodell und eine Kern-Ontologie für die objektorientierte Umweltmodel- 
lierung definiert werden, welche anschließend als Grundlage der adaptiven 
Umweltmodellierung und für das Erlernen neuer Konzepte dienen. 


Sowohl für die quantitative Modellbewertung als auch für die adaptive Wis- 
sensverwaltung ist die Zuordnung von Repräsentanten zu Konzepten von 
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Bedeutung. In Kapitel 6 wird daher auf das Thema der Repräsentant-zu- 
Konzept Zuordnung im objektorientierten Umweltmodell eingegangen, wel- 
ches in den Kapiteln 7 und 8 wieder aufgegriffen wird. 


3.3 Zusammenfassung 


In diesem Kapitel wurde zunächst das zentrale Thema dieser Arbeit, die 
adaptive Umweltmodellierung, als eine wichtige Problemstellung innerhalb 
der objektorientierten Umweltmodellierung motiviert. Die adaptive Um- 
weltmodellierung betrifft dabei die Fähigkeit eines Umweltmodells, adaptiv 
auf Situationen reagieren zu können, in welchen das in einem Hintergrund- 
wissensmodell modellierte Vorwissen nicht mehr ausreichend ist. Es wurde 
dargelegt, dass eine solche adaptive Umweltmodellierung anhand von ge- 
wissen Prinzipien erfolgen sollte, darunter die Bedarfsgerechtheit, Relevanz 
und Nachvollziehbarkeit von Modellanpassungen sowie eine Ausgewogen- 
heit zwischen Komplexität und Ausdrucksstärke eines Modells. Weiterhin 
wurden die Aufgaben innerhalb der adaptiven Umweltmodellierung vorge- 
stellt. Wichtige Aspekte betreffen dabei die quantitative Bewertung der Güte 
eines Modells sowie die adaptive Verwaltung des repräsentierten Wissens. 
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Das dieser Arbeit zugrunde liegende objektorientierte Umweltmodell 
OOWM zeichnet sich durch eine zweigeteilte Architektur aus. Den einen 
Teil dieser Architektur stellt die Weltmodell-Komponente dar, welche 
mit ihrer probabilistischen Informationsverwaltung detailliert bereits in 
Vorarbeiten zu dieser Arbeit diskutiert wird. Die Darstellung von klassen- 
bezogenem Vorwissen in der Hintergrundwissens-Komponente wird in 
diesen Vorarbeiten allerdings nur konzeptuell betrachtet. 


Ein Ziel dieser Arbeit ist es, das Vorgehen zur Reprasentation von Vorwis- 
sen fiir das OOWM detaillierter auszugestalten. In diesem Kapitel wird da- 
her ein Ansatz entwickelt und vorgestellt, mit welchem Vorwissen in einer 
auf die Maßgaben der objektorientierten Umweltmodellierung zugeschnit- 
tenen Form repräsentiert werden kann. Bei diesen Maßgaben steht vor al- 
lem die probabilistische Modellierung der Eigenschaften von Entitäten im 
Vordergrund. Weiterhin muss allerdings auch eine Möglichkeit geschaffen 
werden, komplexes Vorwissen bzgl. einer Domäne strukturiert darstellen zu 
können und den weiteren Komponenten eines technisch kognitiven Systems 
zugänglich zu machen. Schließlich müssen auch die zusätzlichen Anforde- 
rungen beachtet werden, die sich aus der Annahme einer offenen Welt er- 
geben sowie der für diesen Fall notwendigen adaptiven Modellanpassung. 


In Abschnitt 4.1 werden daher zunächst die Anforderungen an eine Re- 
präsentation von Vorwissen in der objektorientierten Umweltmodellierung 
ermittelt und inhaltlich aufgearbeitet. Abschnitt 4.2 stellt darauf aufbauend 
das gewählte Vorgehen zur Strukturierung von Hintergrundwissens- 
modellen überblicksweise vor. Die Abschnitte 4.3 und 4.4 beschreiben 
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anschließend, wie dieses Vorgehen durch eine Metamodellierung und durch 
die Integration einer Top-Level Ontologie umgesetzt wurde. Abschnitt 4.5 
beschreibt, wie auf Basis dieser Umsetzung dann spezifische Modelle zur 
Beschreibung von Anwendungsdomänen erstellt werden können. In Ab- 
schnitt 4.6 wird zur Demonstration des entwickelten Ansatzes schließlich 
ein beispielhaftes Domänenmodell für eine Haushaltsumgebung vorgestellt. 


4.1 Anforderungen an die Repräsentation 
von Vorwissen 


In diesem Abschnitt werden Anforderungen diskutiert, welche sich an ei- 
ne Repräsentation von Vorwissen in der Hintergrundwissens-Komponente 
des objektorientierten Umweltmodells ergeben. Dazu werden zunächst die 
relevanten Eigenschaften eines Hintergrundwissensmodells, wie sie in Vor- 
arbeiten genannt werden, in den Abschnitten 4.1.1 und 4.1.2 dargelegt. An- 
schließend werden in Abschnitt 4.1.3 weitergehende Aspekte diskutiert. 


4.1.1 Allgemeine Anforderungen 


In den Vorarbeiten zu dieser Arbeit wird ein Hintergrundwissensmodell 
für die objektorientierte Umweltmodellierung allgemein als eine Ontologie 
oder als eine Menge hierarchisch angeordneter Klassen mit Attributen 
und Relationen beschrieben [Ghe10b, Küh10]. Dabei legt das Hintergrund- 
wissensmodell die Typen der für eine Domäne relevanten Entitäten und 
Beziehungen fest sowie die Eigenschaften, mit welchen diese beschrieben 
werden können [Bel09, Küh10]. Diese Eigenschaften werden weiterhin 
probabilistisch repräsentiert im Sinne von DoB-Verteilungen' und können 
unterschiedliche Skalenniveaus besitzen [Bey07, Ghe10b, Heil0]. Für die 
probabilistische Verwaltung von Informationen im Weltmodell werden 
weiterhin Parameterwerte benötigt, die dabei vom Typ einer Entität oder 


* Wahrscheinlichkeitsverteilungen im Bayes’schen Sinne des Grades des Dafürhaltens 
(„Degree-of-Belief“) 
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Beziehung sowie von der Art einer Eigenschaft abhängen können, wie 
z.B. ein Alterungsfaktor für Informationen [Heil0] oder ein Diskretisie- 
rungsparameter für Attribute [Bell2a]. Ein Hintergrundwissensmodell 
der objektorientierten Umweltmodellierung muss somit zumindest die 
nachfolgend genannten Aspekte der Wissensrepräsentation unterstützen: 


« Repräsentation von Klassen von Entitäten zur Beschreibung der 
unterschiedlichen Entitätstypen, 


« Repräsentation von Klassen von Relationen zur Beschreibung der 
unterschiedlichen Beziehungstypen, 


e Repräsentation verschiedener Arten von Attributen zur 
Beschreibung der unterschiedlichen Eigenschaften von Entitäten und 
Relationen, 


« Repräsentation von unsicherheitsbehafteten Attributwerten mittels 
Wahrscheinlichkeitsverteilungen, 


e eine begriffliche Unterscheidung von Attributen unterschiedlicher 
Skalenniveaus sowie 


« die Angabe von Parametern für Klassen von Entitäten und 
Relationen sowie für Arten von Attributen bzgl. Aspekten der 
probabilistischen Informationsverwaltung. 


Das objektorientierte Umweltmodell ist weiterhin als ein Umweltmodell 
ausgelegt, welches nicht per se auf eine bestimmte Anwendungsdomäne be- 
schränkt oder zugeschnitten ist. Bisherige Anwendungsbereiche umfassen 
z.B. die Situationsdarstellung für Videoüberwachungssysteme [Bau09] bzw. 
die Bereitstellung einer Gedächtnisstruktur für die Servicerobotik [Ghe10b] 
oder das autonome Fahren [Hei10]. Eine weitere, allgemeine Anforderung 
für die objektorientierte Umweltmodellierung ist es somit, unterschiedli- 
che Hintergrundwissensmodelle für verschiedene Anwendungsdomänen 
einbinden und anwenden zu können. Die Prinzipien, nach denen solche 
Modelle aufzubauen sind, müssen somit unabhängig von einer konkreten 
Anwendungsdomäne beschrieben werden. 
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4.1.2 Anforderungen an die Repräsentation von 
Unsicherheiten 


Die Repräsentation von Unsicherheiten mittels DoB-Verteilungen stellt ei- 
nen wichtigen Aspekt der objektorientierten Umweltmodellierung dar, wel- 
cher diese z.B. auch von anderen Arten von Wissensbasen unterscheidet. 
Eine unsicherheitsbehaftete Repräsentation beschreibt stets auch einen pro- 
babilistischen Zusammenhang zwischen allen unsicherheitsbehafteten Grö- 
ßen eines Modells in Form einer gemeinsamen Wahrscheinlichkeitsvertei- 
lung dieser Größen. Die Repräsentation dieser gemeinsamen Wahrschein- 
lichkeitsverteilung kann auf unterschiedlich komplexe Art und Weise erfol- 
gen. Die Komplexität betrifft dabei u.a. die Art der Modellierung von unsi- 
cherem Wissen sowie ebenfalls eine auf Basis eines solches Modells durchge- 
führte Inferenz, z.B. hinsichtlich ihrer Laufzeit. Charakterisieren lässt sich 
diese Komplexität im Hinblick auf die Unabhängigkeitsannahmen, welche 
bzgl. der beteiligten Größen getroffen werden. Für die probabilistische In- 
formationsrepräsentation in der Weltmodell-Komponente des OOWM las- 
sen sich nach Bauer [Bau09] z. B. folgende Stufen unterscheiden: 


Keine Unabhängigkeitsannahmen: es wird von einer allgemeinen gemeinsa- 
men Verteilung über den Attributen (als probabilistische Größen) aller 
Repräsentanten und Relationen des Weltmodells ohne weitere Unab- 
hängigkeitsannahmen ausgegangen. 


Die Annahme stochastisch unabhängiger Repräsentanten: alle Repräsentan- 
ten und Relationen im Weltmodell werden als jeweils stochastisch un- 
abhängig voneinander angenommen. Die gemeinsame Verteilung aller 
probabilistischen Größen lässt sich somit faktorisiert als das Produkt 
der (gemeinsamen) Verteilungen aller Repräsentanten bzw. Relatio- 
nen darstellen. 


Die Annahme von bedingt stochastisch unabhängigen Attributen für stochas- 
tisch unabhängige Repräsentanten: Die Attribute jedes Repräsentanten 
bzw. jeder Relation werden zusätzlich als bedingt unabhängig angese- 
hen, gegeben ihren Repräsentanten bzw. ihre Relation. Die (gemein- 
same) Verteilung eines jeden Repräsentanten bzw. jeder Relation lässt 
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sich somit ebenfalls faktorisiert als das Produkt der DoB-Verteilungen 
aller enthaltenen Attribute darstellen. 


Allgemein wird in Anwendungen des OOWM die zuletzt genannte stärkste 
Annahme der bedingt stochastisch unabhängigen Attribute verwendet. 


Für die Hintergrundwissens-Komponente des OOWM stellt sich nun eben- 
falls die Frage, auf welche Art und Weise unsicheres Wissen angemessen 
repräsentiert werden soll. Die Angemessenheit einer Repräsentation muss 
dabei anhand der Aufgaben beurteilt werden, für welche Vorwissen, und 
insbesondere unsicheres Wissen, in der objektorientierten Umweltmodel- 
lierung benötigt wird. Durch Vorwissen soll die Bedeutung von modellier- 
ten Domänen-Entitäten sowie weitere semantische Aspekte dem kognitiven 
System zugänglich gemacht werden [Ghe08, Küh10]. Dies betrifft z. B. Fra- 
gestellungen, wie welchem Zweck ein Objekt dient oder welche Fähigkeiten 
ein Objekt besitzt, sowie Fragestellungen, wie mit welchem Werkzeug ei- 
ne gegebene Aufgabe gelöst werden kann. Vorwissen, welches für derartige 
Aufgaben benötigt wird, kann wie in Abschnitt 2.2.3 beschrieben prinzipiell 
über das Mittel der Vernetzung von modellierten Konzepten durch Relatio- 
nen, also in Form von semantischen Netzen, erreicht werden. Eine weitere 
Aufgabe des Hintergrundwissensmodells ist es, die dynamische probabilisti- 
sche Klassifikation von Repräsentanten des Weltmodells zu ermöglichen, auf 
Basis ihrer beobachteten Eigenschaften [Bau09, Ghe10b, Küh10]. Zu diesem 
Zweck werden die DoB-Verteilungen der Attribute eines Repräsentanten mit 
den Attribut-Verteilungen der modellierten Konzepte verglichen. Wurde ein 
Repräsentant erfolgreich klassifiziert, so besteht eine weitere Aufgabe dar- 
in, zusätzliche, bisher nicht beobachtete Informationen über diesen Reprä- 
sentanten bereitzustellen, in Form von erwarteten Werten für die entspre- 
chenden Eigenschaften der repräsentierten Entität [Ghe10b, Küh10]. Dieser 
Vorgang wird als die Vervollständigung von Repräsentanten auf Basis von 
Vorwissen bezeichnet. Die letzten beiden Aspekte stellen dabei Anforderun- 
gen an die probabilistische Informationsrepräsentation im Hintergrundwis- 
sen der objektorientierten Umweltmodellierung. Diese Aspekte müssen so- 
mit durch eine entsprechende Repräsentation von unsicherem Wissen un- 
terstützt werden. 
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Im Gegensatz zu anderen probabilistischen Modellen besteht allerdings nicht 
die allgemeine Anforderung, probabilistische Zusammenhänge zwischen 
Konzepten bzw. zwischen ihren Attributen derart im Hintergrundwissens- 
modell darzustellen, dass eine probabilistische Inferenz unterstützt werden 
kann. Eine solche Inferenz würde es ermöglichen, ausgehend von bestimm- 
ten gegebenen Attributwerten als Evidenzen, auf die Verteilung der Werte 
anderer Attribute (in anderen Konzepten) zu schließen. Derartige Aspekte 
werden nach den Entwurfsprinzipien des objektorientierten Umweltmodells 
OOWAM als die Aufgaben von nachgelagerten Komponenten im technisch 
kognitiven System betrachtet, welchen das OOWM allerdings zu diesem 
Zweck seine Informationen zur Verfügung stellt’. 


Betrachtet man diese Anforderungen insgesamt, so kann für ein probabi- 
listisches Hintergrundwissensmodell der objektorientierten Umweltmodel- 
lierung die Annahme von stochastisch unabhängigen Konzepten getroffen 
werden. Weiterhin können die Attribute eines Konzepts als bedingt unab- 
hängig angenommen werden, gegeben das Konzept. Eine derartige Model- 
lierung deckt einerseits die oben genannten Anforderungen ab und verein- 
facht andererseits sowohl die Erstellung eines entsprechenden probabilis- 
tischen Hintergrundwissensmodells als auch dessen Anwendung (z.B. zur 
Klassifikation von Repräsentanten, aber auch bzgl. der quantitativen Mo- 
dellbewertung wie in den Kapiteln 6 bzw. 7 beschrieben). Das Hintergrund- 
wissensmodell kann somit mittels gleichartiger Unabhängigkeitsannahmen 
repräsentiert werden wie die Weltmodell-Komponente in [Bau09]. 


4.1.3 Weitergehende Aspekte 


In dieser Arbeit steht die Annahme einer offenen Welt im Vordergrund. Die- 
se Annahme besitzt auch Konsequenzen für ein Hintergrundwissensmodell. 


* Ausgenommen von dieser Formulierung sei die Vervollständigung von Repräsentanten, in 
welcher, bedingt auf den Typ eines Repräsentanten, ebenfalls die Verteilung weiterer Attri- 
butwerte abgeleitet wird. 
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Im Speziellen muss z.B. davon ausgegangen werden, dass zur Entwurfs- 
zeit des Modells nicht alle Typen von relevanten Entitäten der betrachte- 
ten Domäne bekannt sind - und somit auch nicht als Konzepte modelliert 
werden können. Ein offenes Hintergrundwissensmodell muss es also unter- 
stützen, zur Laufzeit um zusätzliche Konzepte erweitert zu werden, d.h. es 
muss grundsätzlich als erweiterbar entworfen werden. Erweiterbarkeit be- 
trifft an dieser Stelle Aspekte wie die klare Strukturierung des Modells, das 
Anwenden von Entwurfsprinzipien oder Vorgehensmodellen während sei- 
ner Entwicklung, die Dokumentation des Modells sowie seine weitgehende 
Formalisierung. Beide zuletzt genannten Aspekte zielen dabei darauf ab, ein 
konsistentes Einordnen und Hinzufügen von neu gelernten Konzepten zu- 
mindest auf semi-automatische Weise unterstützen zu können. 


Das Hinzufügen zusätzlicher Konzepte zum Hintergrundwissensmodell 
wird in dieser Arbeit als eine Aufgabe des Konzeptlernens interpretiert. Bei 
dieser Art der induktiven Inferenz wird aus einzelnen Beispielen auf das 
Allgemeine geschlossen. Für das objektorientierte Umweltmodell bedeutet 
dies, das aufgrund von beobachteten Entitäten, dargestellt als Repräsentan- 
ten des Weltmodells, auf neue Konzepte geschlossen wird, als Typen für 
diese Entitäten. Die Struktur des Hintergrundwissensmodells stellt dabei 
den induktiven Bias für dieses Konzeptlernen dar, da sie vorgibt, wie neu 
zu lernende Konzepte als Hypothesen repräsentiert werden können. Dies 
bedeutet im Speziellen, dass sowohl die Art und Weise, wie erworbene 
Umgebungsinformationen durch Repräsentanten im Weltmodell dargestellt 
werden, als auch die Art und Weise, wie Konzepte im Hintergrundwis- 
sen definiert und beschrieben werden, auf übergeordneter Ebene formal 
definiert werden müssen. Dies entspricht einem Metamodell für die Infor- 
mationsrepräsentation in der objektorientierten Umweltmodellierung. Neu 
zu lernende Konzepte müssen dann nach den Vorgaben dieses Metamodells 
beschrieben werden. Weiterhin muss die Darstellung von Repräsentanten 
dahingehend kompatibel zur Darstellung von Konzepten sein, dass Reprä- 
sentanten und ihre Informationen als Lerndaten für die Definition neuer 
Konzepte Verwendung finden können. Diese Anforderungen bedeuten 
für die objektorientierte Umweltmodellierung im Wesentlichen, dass die 
Darstellung von Attributen in Repräsentanten und Konzepten durch ein 
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Metamodell formal definiert werden muss. Hier sind vor allem die mögli- 
chen Arten von Attributen in Bezug auf Aspekte wie ihr Skalenniveau, ihren 
Wertebereich oder weitere Metaeigenschaften festzulegen. In Abhängigkeit 
des Skalenniveaus eines Attributtyps kann dann z.B. definiert werden, wie 
während des Konzeptlernens gegebene Lernbeispiele für Attributwerte zu 
Konzeptattributen generalisiert werden. 


Eine weitere grundlegende Annahme der Wissensmodellierung in der ob- 
jektorientierten Umweltmodellierung ist es, dass ein Wissensmodell anwen- 
dungsrelevantes Vorwissen repräsentiert, welches a priori zur Entwurfszeit 
eines Systems von Experten erfasst, aufgearbeitet und schließlich formal re- 
präsentiert wurde. Für die Erstellung eines solchen Wissensmodells spielt 
auch die Qualitätssicherung des Erstellungsprozesses eine wichtige Rolle, 
um ein konsistentes, qualitativ hochwertiges Wissensmodell zu erhalten. 
Trotz der Annahme einer offenen Welt wird also für die Wissensmodellie- 
rung in der adaptiven Umweltmodellierung nicht davon ausgegangen, dass 
ein Wissensmodell zur Laufzeit eines Systems neu erstellt werden muss, sei 
es von Null an oder auf Basis einer Skelettstruktur. Es wird dagegen ange- 
nommen, dass ein existierendes Wissensmodell an die Unabwägbarkeiten 
einer Domäne anzupassen ist und diese Anpassungen nur innerhalb eines 
gewissen Rahmens erfolgen sollen (z. B. im Hinblick auf die Anzahl der neu- 
en oder geänderten Konzepte). 


Das modellierte Wissen soll weiterhin so weit wie möglich nachvollziehbar 
und verständlich sein. Wird ein objektorientiertes Umweltmodell beispiels- 
weise in einem technisch kognitiven System eingesetzt, welches der Un- 
terstützung der menschlichen Entscheidungsfindung dient, so müssen vom 
System generierte Entscheidungsvorschläge transparent und nachvollzieh- 
bar sein. Ein formal repräsentiertes Wissensmodell leistet in solchen Sys- 
temen oft einen wesentlichen Beitrag zur Generierung solcher Vorschläge, 
z.B. durch die Ermöglichung von logischer Inferenz. Ein nicht nachvollzieh- 
bares Domänenmodell kann negative Auswirkungen auf die Transparenz 
der Entscheidungsfindung haben. Auch in Bezug auf die allgemeine Erwei- 
terbarkeit eines Domänenmodells sowie konkrete Erweiterungen spielt die 
Nachvollziehbarkeit des Modells eine wichtige Rolle. Beispielsweise müssen 
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bereits zur Durchführung von manuellen Erweiterungen eines Modells des- 
sen Grundprinzipien verstanden werden. Auch falls eine automatisch oder 
semi-automatisch durchgeführte Erweiterung überprüft oder bewertet wer- 
den soll, muss ein grundsätzliches Verständnis des Modells und der mög- 
lichen Auswirkungen einer Änderung vorhanden sein. Nachvollziehbarkeit 
und Verständlichkeit stellen somit weitere, nichtfunktionale Anforderungen 
an ein Hintergrundwissensmodell der Umweltmodellierung dar. 


4.2 Gewähltes Vorgehen zur Strukturierung 
von Hintergrundwissen 


In Kapitel 2.2 wurde der Stand der Technik von Verfahren zur Wissensre- 
präsentation für kognitive Systeme dargelegt. Nachfolgend werden diesem 
Stand die für ein Hintergrundwissensmodell in der objektorientierten Um- 
weltmodellierung ermittelten Anforderungen gegenübergestellt, sowohl in 
Bezug auf semantische als auch probabilistische Aspekte. Dabei werden im 
Besonderen zwei Aspekte betrachtet: 


e Mittels welcher Repräsentationsform bzw. Sprache kann Vorwissen im 
Hintergrundwissensmodell formal repräsentiert werden, um den oben 
genannten Anforderungen gerecht zu werden? 


« Wie kann eine grundlegende Strukturierung für in einem Hinter- 
grundwissensmodell zu modellierendes Wissen unter den genannten 
Anforderungen erfolgen? Können dazu existierende Top-Level Onto- 
logien eingebunden werden? 


Anschließend wird als Schlussfolgerung aus diesen Betrachtungen das für 
diese Arbeit gewählte Vorgehen zur Repräsentation und Strukturierung von 
Hintergrundwissen für die adaptive Umweltmodellierung beschrieben. 
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4.2.1 Bewertung der Stand-der-Technik Ansätze 


An dieser Stelle erfolgt eine spezifische Bewertung und Zusammenfassung 
der in Kapitel 2 dargestellten relevanten Ansätze aus der Literatur. Spezifisch 
erfolgt die Betrachtung dabei in Bezug auf die dargelegten Anforderungen 
der objektorientierten und adaptiven Umweltmodellierung. Die Anteile der 
formalen Wissensrepräsentation und der inhaltlichen grundlegenden Struk- 
turierung von Wissen werden getrennt dargestellt. Abgeleitet aus dieser Be- 
wertung wird anschließend das eigene Vorgehen vorgestellt. 


Wissensrepräsentation 


Als Stand der Technik zur relationalen Wissensrepräsentation stellen Be- 
schreibungslogiken einen guten Kompromiss zwischen Ausdrucksmächtig- 
keit der Sprache, Formalität, Inferenzmöglichkeiten sowie Werkzeugunter- 
stützung für eine Verwaltung und Wartung erstellter Modelle mit vertret- 
barem Zeitaufwand dar. Die mittels einer Ontologie in Beschreibungslogik 
erstellte Terminologie zur Beschreibung einer Domäne ist weiterhin flexi- 
bel genug, um auch die Modellierung einer offenen Welt zu unterstützen, 
in welcher im Verlauf der Zeit neue Konzepte zu einem Domänenmodell 
hinzukommen können. Dem gegenüber stehen z.B. datenbankorientierte 
Modelle mit ihren festen Schemata für eine Domäne. Als konkrete Umset- 
zung einer Beschreibungslogik bietet insbesondere OWL (DL) den Vorteil 
einer standardisierten Sprache mit breiter Werkzeugunterstützung, z.B. in 
Form von Ontologie-Editoren mit Schnittstellen zur Integration von aktu- 
ellen Reasoning-Verfahren. Dies ermöglicht, zumindest für die relationalen 
Anteile eines Domänenmodells, bereits zur Entwicklungszeit die Durchfüh- 
rung von Konsistenzprüfungen für das Modell. 


Allerdings unterstützt OWL per se nicht die Darstellung von unsicherheits- 
behaftetem Wissen. Zu diesem Zweck können die in Kapitel 2.2.4 erwähn- 
ten logisch-probabilistischen Sprachen wie OPRML und PR-OWL verwendet 
werden. PR-OWL setzt dabei in Form einer transparenten Erweiterung auf 
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OWL auf und ermöglicht es somit, existierende OWL Modelle auch nach- 
träglich um probabilistische Informationen zu ergänzen. Logisch-probabilis- 
tische Sprachen dienen dabei i. A. dazu, die gemeinsame Wahrscheinlich- 
keitsverteilung einer Menge von als Zufallsvariablen interpretierten Attri- 
buten von Objekten darzustellen. Das Ziel ist dabei, auf die Verteilung der 
möglichen Werte einer Teilmenge dieser Attribute schließen zu können, ge- 
geben die Werte für eine andere Teilmenge der Attribute - also probabi- 
listische Inferenz. Die logisch-probabilistischen Sprachen legen daher ihren 
Fokus darauf, probabilistische Zusammenhänge modular mittels lokaler Mo- 
delle darzustellen und auf Basis dieser Modelle Anfragen beantworten zu 
können. Eine Modellierung probabilistischer Attribute nach semantischen 
Kriterien steht dabei nicht im Vordergrund, wie beispielsweise eine Zuord- 
nung von Zufallsvariablen zu Skalenniveaus. Darüber hinaus unterstützen 
viele Sprachen oft nur diskrete Zufallsvariablen, entweder per se (z.B. PRM 
[Kol98], OPRML [How09]) oder in ihrer praktischen Anwendung (z.B. PR- 
OWL [Cos05, Car11, Las11]). Stetige Merkmale müssen in diesen Sprachen 
daher zunächst entsprechend diskretisiert werden. 


Die Eigenschaften von logisch-probabilistischen Sprachen und die Anforde- 
rungen an eine Wissensrepräsentation in der objektorientierten Umweltmo- 
dellierung besitzen somit eine nicht unwesentliche Schnittmenge, sind aber 
dennoch auch nicht deckungsgleich. Der Fokus der Wissensrepräsentation 
von logisch-probabilistischen Sprachen liegt klar auf einer Unterstützung 
der probabilistischen Inferenz, welche beim Umweltmodell OOWM ausge- 
lagert ist auf andere Komponenten des kognitiven Systems. Der Fokus ei- 
nes Hintergrundwissensmodells in der objektorientierten Umweltmodellie- 
rung ist die probabilistische Repräsentation von unsicherem Wissen in einer 
Form, welche die Erfüllung der oben genannten Aufgaben ermöglicht sowie 
die probabilistische Informationsverarbeitung des OOWM möglichst gut un- 
terstützt. Dabei müssen nicht nur diskrete, sondern auch stetige Merkmale in 
Form von DoB-Verteilungen repräsentiert werden können. Weiterhin müs- 
sen probabilistische Attribute auch mit semantischen Information annotiert 
werden können, wie den ihnen zugrunde liegenden Skalenniveaus, Maßein- 
heiten etc. 
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Als Folge dieser Eigenschaften von logisch-probabilistischen Sprachen kann 
in dieser Arbeit nicht direkt auf solchen Sprachen aufgesetzt werden. Der für 
diese Arbeit gewählte Ansatz zur Strukturierung von Hintergrundwissens- 
modellen setzt somit direkt auf OWL (2 DL) aufund erweitert dieses um eine 
eigene Möglichkeit zur Darstellung der benötigten probabilistischen Infor- 
mationen. Die Verwendung von OWL als Basis ermöglicht jedoch immer- 
hin eine gewisse Grund-Kompatibilität zur logisch-probabilistische Sprache 
PR-OWL. Nachgelagerte Komponenten des kognitiven Systems können z.B. 
die Terminologie des Hintergrundwissensmodells und die modellierten pro- 
babilistischen Informationen unter Anwendung von einfachen Transforma- 
tionen nach PR-OWL überführen. So kann das in einem objektorientierten 
Umweltmodell modellierte Wissen als Grundlage zur Definition weiterer, 
auf Inferenz ausgerichteter Modelle genutzt werden. 


Strukturierung von Wissen 


Neben der Repräsentationssprache, in welcher Wissen in einem Hin- 
tergrundwissensmodell dargestellt werden soll, sind auch zwei weitere 
Entwurfsaspekte für die adaptive Umweltmodellierung interessant. Dies ist 
einerseits die grundlegende (d.h. kategorische) Strukturierung des darzu- 
stellenden Wissens in einem Hintergrundwissensmodell sowie andererseits 
die Frage, ob zu diesem Zweck auf einer existierenden Top-Level Ontologie 
aufgesetzt werden kann und soll. In Abschnitt 2.2.4 wurde ein Überblick 
über verschiedene relevante Stand-der-Technik Ansätze zur Umweltmodel- 
lierung und existierende Wissensbasen gegeben. Einige der betrachteten 
Umweltmodelle nutzen dabei direkt eine logisch-probabilistische Spra- 
che zur Wissensrepräsentation, z.B. in den Bereichen der Lagedarstellung 
[How09, Las11] oder des autonomen Fahrens [Sch14]. Die Ansätze beschrei- 
ben meist weniger umfangreiche Domänenmodelle und verzichten auf die 
explizite Einbindung einer Top-Level Ontologie. Im Bereich der Servicero- 
botik setzen viele der betrachteten Ansätze auf OWL DL als Repräsentati- 
onssprache auf und nutzen dieses zur Erstellung eigener Wissensmodelle 
(z.B. [Ten09, Lim11, Lem11]). Zur Strukturierung dieser Wissensmodelle 
findet dabei häufig die Top-Level Ontologie der Wissensbasis Cyc [Len95] 
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(in ihrer quelloffenen Variante OpenCyc) Verwendung. Weitere Ansätze 
(z.B. [Dao13]) setzen auch DOLCE [Mas03] als Top-Level Ontologie ein. 


Der Einsatz von Cyc als Top-Level Ontologie ermöglicht es, auf die große 
Menge von modellierten Konzepten in der Wissensbasis von Cyc zugrei- 
fen zu können. Weiterhin sind Abbildungen dieser Konzepte zu weiteren 
Wissensmodellen, wie z. B. WordNet [Mil95], definiert. Cyc wurde allerdings 
nicht dafür entwickelt, probabilistische Informationen für eine Erkennung 
von Objekten darstellen zu können. Weiterhin ist Cyc proprietär. Alternati- 
ven zu Cyc sind durch die Top-Level Ontologien DOLCE’ [Mas03] und SU- 
MO? [Nil01] gegeben. SUMO stellt dabei eine frei verfügbare und standardi- 
sierte Top-Level Ontologie dar, welche aus der Verschmelzung von vorher- 
gehenden Ontologien entstanden ist. DOLCE ist ebenfalls frei verfiigbar und 
soll zur grundlegenden Strukturierung von Wissen im Bereich der mensch- 
lichen Kognition und Sprache dienen. Beide Top-Level Ontologien wurden 
unter internationaler Beteiligung entwickelt und reprasentieren somit ei- 
nen breiteren Konsens [Sch06]. Sie sind jeweils explizit dafiir gedacht, als 
Startpunkt für die Entwicklung eigener Domänenmodelle zu dienen. Auch 
DOLCE und SUMO beschreiben keine direkten Möglichkeiten, um proba- 
bilistische Attribute für Konzepte darzustellen. Allerdings sind sie explizit 
für ihre Erweiterung ausgelegt. Bei der Entwicklung der Wissensstruktur in 
DOLCE wurde weiterhin besondere Aufmerksamkeit auf die Einhaltung von 
Prinzipien der formalen Ontologie, eine Dokumentation von Entwurfsent- 
scheidung sowie eine umfassende Axiomatisierung gelegt [Mas03]. Dem- 
gegenüber wurden für andere Top-Level Ontologien in [Gua04] beispiels- 
weise unter Anwendung der OntoClean Entwurfsmethodik für formale On- 
tologien Defizite in der Wissensstrukturierung festgestellt. Weitere Ansät- 
ze wie WordNet [Mil95], ConceptNet [Liu04], DBPedia [Leh15] oder YAGO 
[Reb16] stellen ebenfalls große Wissensbasen für Allgemeinwissen dar, sind 
aber nicht explizit als Top-Level Ontologien ausgelegt oder formal logisch 
repräsentiert, sondern stellen semantisch vernetztes Wissen dar. 


* Descriptive Ontology for Linguistic and Cognitive Engineering 
2 Suggested Upper Merged Ontology 


109 


4 Strukturierung und Repräsentation von Vorwissen 


Um den Anforderungen in der objektorientierten Umweltmodellierung nach 
Erweiterbarkeit, Nachvollziehbarkeit und Domänenunabhängigkeit einer 
Top-Level Ontologie Rechnung zu tragen, wurde in dieser Arbeit DOLCE 
als Top-Level Ontologie und Modell für eine grundlegende Wissensstruk- 
turierung ausgewählt. Für DOLCE steht eine Umsetzung! in OWL DL frei 
zur Verfügung. Die Axiomatisierung dieser Umsetzung ist allerdings auf- 
grund der Sprachrestriktionen von OWL DL gegenüber der ursprünglichen 
Beschreibung in Prädikatenlogik entsprechend reduziert. Diese Umsetzung 
dient in Verbindung mit der grundlegenden Wissensstrukturierung im 
Folgenden als Grundlage, um die Repräsentation von probabilistischen 
Informationen für die objektorientierte Umweltmodellierung einzuführen. 


4.2.2 Gewähltes Vorgehen 


In dieser Arbeit werden nun Möglichkeiten betrachtet, Vorwissen struktu- 
riert und formal in der Hintergrundwissens-Komponente des objektorien- 
tierten Umweltmodells abzulegen. Dabei soll ebenfalls das Erlernen neuer 
Konzepte auf Basis von Beobachtungsinformationen im Weltmodell ermög- 
licht werden. Die objektorientierte Umweltmodellierung ist ihren Grund- 
sätzen nach ein domänen-agnostischer Ansatz. Erst für eine konkrete An- 
wendung in einer gegebenen Domäne wird das Hintergrundwissen spezia- 
lisiert, z.B. durch ein entsprechendes Domänenmodell. Eine Strukturierung 
des Vorwissens muss aus diesem Grund auf einer übergeordneten Ebene er- 
folgen. Zu diesem Zweck wird für die Hintergrundwissens-Komponente in 
dieser Arbeit zunächst ein Metamodell auf konzeptueller Ebene definiert. 
Durch dieses Metamodell wird das grundsätzliche Vorgehen zur Repräsenta- 
tion von probabilistischen Informationen für Attribute und Relationen fest- 
gelegt. Anschließend wird die prinzipielle kategorische Strukturierung von 
Wissen betrachtet und durch Auswahl und Integration der Top-Level Onto- 
logie DOLCE spezifiziert. Dies wird in Abschnitt 4.4 dargestellt. 


* DOLCE Lite, siehe: http://www.loa.istc.cnr.it/dolce/overview.html (letzter Abruf: 08.05.2020) 
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Metamodelle werden verwendet, wenn ein Modell selbst Gegenstand der 
Modellierung ist [Str13b]. Soll beschrieben werden, nach welchen Prinzipi- 
en mögliche Domänenmodelle der objektorientierten Umweltmodellierung 
aufgebaut sind, so stellt sich diese Beschreibung ebenfalls als ein Metamo- 
dell dar. Ein Metamodell legt dabei die Sprache fest, in welcher das zu de- 
finierende Modell formuliert werden kann [Str13b]. Für die objektorientier- 
te Umweltmodellierung soll ein Metamodell im Speziellen solche Informa- 
tionen bereitstellen, welche als Metawissen von anderen Anteilen des Um- 
weltmodells zur Durchführung ihrer Aufgaben, z. B. einer Informationsver- 
arbeitung, benötigt werden. Dies betrifft beispielsweise die Frage, wie die 
Merkmale einer Entität repräsentiert werden (z.B. bzgl. Skalenniveau und 
Wertebereich) und wie diese verarbeitet werden können, aber nicht die Ver- 
arbeitung selbst. Konkret dient die Metamodellierung für Hintergrundwis- 
sensmodelle in dieser Arbeit mehreren Zwecken: 


e Zunächst soll eine einheitliche konzeptuelle Struktur und Begriffswelt 
für die Modellelemente, die zur Beschreibung von Anwendungsdomä- 
nen verwendet werden, geschaffen werden. 


« Weiterhin soll auch die Bedeutung derjenigen Modellelemente, die 
in der internen Informationsverarbeitung Anwendung finden, präzise 
definiert werden (z.B. verschiedene Arten von Attributen). 


« Im Speziellen soll durch ein Metamodell grob der induktive Bias 
festgelegt werden, welcher für ein generalisierendes Lernen neuer 
Konzepte aus wenigen Beobachtungen benötigt wird. Ein Metamodell 
strukturiert dabei auf gewisse Weise den Raum der Hypothesen, als 
welche neu zu lernende Konzepte aufgefasst werden können. 


e Weiterhin soll auch die Interoperabilität des objektorientierten Um- 
weltmodells auf semantischer Ebene gefördert werden, indem Schnitt- 
stellen und Datenstrukturen beschrieben werden, mit welchen z.B. 
von Sensoren gemachte Beobachtungen beschrieben und an das Um- 
weltmodell übergeben werden können. 


Dabei müssen in einem Metamodell für das Hintergrundwissen der objekt- 
orientierten Umweltmodellierung zumindest folgende Aspekte betrachtet 
und festgelegt werden: 
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« Repräsentation von Klassen von Entitäten (Typen) mit Attributen und 
Relationen, 


« Repräsentation von unsicherheitsbehafteten Attributwerten mittels 
DoB Wahrscheinlichkeitsverteilungen, 


« Repräsentation von unsicherheitsbehafteten Relationen sowie 


« Unterscheidung von Attributen mit unterschiedlichen Skalenniveaus. 


Die zu diesem Zweck im Metamodell definierten Modellelemente sollen, so- 
weit möglich, auch zueinander in Beziehung gesetzt werden, im Sinne eines 
semantischen Modells. Darüber hinaus betreffen speziellere Aspekte der Me- 
tamodellierung 


« die Unterscheidung von unterschiedlichen Arten von Attributen, z.B. 
in Bezug auf ihre Bedeutung für eine adaptive Umweltmodellierung, 


e die Angabe von Maßeinheiten für von Sensoren beobachtete Werte, 


« die Darstellung der probabilistischen Typzuordnung für Repräsentan- 
ten des Weltmodells zu Klassen (Konzepten) im Hintergrundwissen. 


Weiterhin sind auch Aspekte wie die Darstellung von Ort und Zeit interes- 
sant, diese werden allerdings in Verbindung mit der gewählten Top-Level 
Ontologie diskutiert. Nachfolgend wird nun das für die adaptive Umwelt- 
modellierung entworfene Metamodell im Detail vorgestellt. 


4.3 Metamodellierung 


Das in dieser Arbeit entworfene Metamodell wird zunächst abstrakt be- 
schrieben, bevor es im Weiteren detaillierter vorgestellt wird. Das be- 
schriebene Modell stellt dabei eine Anpassung und Weiterentwicklung des 
initialen, in [Kuw13c] beschriebenen Modells dar. In Abbildung 4.1 ist daher 
zuerst eine abstrakte Sicht auf die wesentlichen Aspekte eines Hintergrund- 
wissensmodells der objektorientierten Umweltmodellierung dargestellt, 
welche die in den genannten Vorarbeiten erwähnten Anteile aufgreift. Im 
Hintergrundwissen sollen die verschiedenen relevanten Arten von Enti- 
täten einer Anwendungsdomäne modelliert werden. Diese werden durch 
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das Modellelement „Domänen-Entität“ repräsentiert, die eine Klasse mit 
einem eindeutigen Namen darstellt, welche über Oberklassen hierarchisch 
angeordnet sein kann. Beschrieben wird jede Art von Domänen-Entität 
durch ihre Attribute, dargestellt durch das Modellelement „Attribut“. Ein 
Attribut bezieht sich dabei auf eine Qualität (d.h. eine Eigenschaft wie 
Länge, Farbe, Form etc.) und wird auf einem bestimmten Skalenniveau mit 
einem gegebenen Wertebereich beschrieben. Jedes Attribut wird in seiner 
Ausprägung durch eine Wahrscheinlichkeitsverteilung repräsentiert, ggf. 
unter Angabe einer Maßeinheit. Unterschiedliche Domänen-Entitäten und 
Arten von Domänen-Entitäten können weiterhin durch Relationen verbun- 
den sein, welche durch das Modellelement „Relation“ dargestellt werden. 
Relationen besitzen einen Definitionsbereich und einen Wertebereich, die 
jeweils festlegen, zwischen welchen Arten von Domänen-Entitäten eine 
entsprechende Beziehung bestehen darf. 


Domänen-Entität 


* 


setztIn- | _ Name beschreibt 
„ mmt- Relation - Oberklasse(n) 


besitzt | 1..* 


- Name - Qualität 
- Ober-Relation - Skalenniveau 


- Definitions- - Wertebereich 
bereich - DoB-Verteilung 
- Wertebereich - Einheit 


* | beschreibt besitzt | * 


Abbildung 4.1: Grundsätzliche Elemente eines Hintergrundwissensmodells der objektorien- 
tierten Umweltmodellierung in Erweiterung zu [Kuw13c] (die Beziehungen 
sind dabei in UML Notation mit Multiplizitäten angegeben). 


Zusätzlich zu den in Abbildung 4.1 gezeigten Anteilen müssen weitere 
Informationen spezifiziert werden können, welche als Parameterwerte 
für die probabilistische Informationsverarbeitung dienen. Für Typen von 
Domänen-Entitäten betrifft dies z.B. einen klassenspezifischen Alterungs- 
faktor [Heil0], welcher ein Absinken der Existenzwahrscheinlichkeit von 
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Instanzen dieses Typs über die Zeit beschreibt. Für Typen von Relationen 
und für Arten von Attributen wird auf diese Informationen nachfolgend bei 
der detaillierten Darstellung des Metamodells eingegangen. Im Wesentli- 
chen entspricht das auf abstrakter Ebene beschriebene Metamodell einem 
Entity-Relationship-Modell mit zusätzlichen probabilistischen Attributen, 
Skalenniveaus und Einheiten als expliziten Modellelementen. 


4.3.1 Grundlegende Darstellung von Attributen 


Eine zentrale Rolle für die Umweltmodellierung spielen die Attribute, über 
welche die definierenden Eigenschaften unterschiedlicher Typen von Enti- 
täten festgelegt werden und mittels derer z.B. die probabilistische Klassi- 
fikation von Repräsentanten des Weltmodells erfolgt. Auf die Darstellung 
von Attributen im Hintergrundwissen wird daher an dieser Stelle detaillier- 
ter eingegangen. Attribute werden beim gewählten Vorgehen in Form eines 
semantischen Netzes repräsentiert, wie in Abbildung 4.2 dargestellt. 


Qualität Dabei referenziert ein Attribut zunächst die Qualität, welche es 
repräsentieren soll (z.B. eine Länge). Wie genau der Begriff einer Qualität 
als eine ontologische Kategorie zu verstehen ist, wird in Abschnitt 4.4 im 
Rahmen der gewählten Top-Level Ontologie erläutert. Qualitäten können an 
sich ebenfalls in einem hierarchischen Modell dargestellt werden und müs- 
sen über eine erklärende Beschreibung verfügen. Zusätzlich werden Quali- 
täten über Angaben wie ihr Skalenniveau oder die Art ihrer Verwendung 
innerhalb eines Anwendungsfalls spezifiziert. 


Skalenniveau Skalenniveaus werden im gewählten Vorgehen als einfa- 
che Symbole aus einem festen Wertevorrat repräsentiert. Sie dienen dabei 
hauptsächlich als Markierungen. Diese Markierungen ermöglichen es, dass 
ein Attribut innerhalb des objektorientierten Umweltmodells oder außer- 
halb in weiteren Komponenten des kognitiven Systems anhand seines Ska- 
lenniveaus unterschiedlich behandelt und verarbeitet werden kann. Für die 
modellierten Skalenniveaus wird eine zugrunde liegende Halbordnung an- 
genommen, welche sich über folgende Ketten definiert: 
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- Basis-Einheit 


hatEinheit _ Faktor 


- Versatz 
DoB- 
hatVerteilung Verteilung 1| Wertebereich 
hatWertebereich [| 


Qualität 1| <<enumeration>> 
ualıta 
Attribut ıL | erlaubtMaxSN| Skalenniveau 
referenziert| - Name 1 
- Oberklasse(n) nominal 
- Beschreibung hatSN | ordinal 
- istZustand intervall 


verhältnis 
absolut 


<<enumeration>> 


1| Szenar-Modus 


wirdVerwendet- | perzeptiv 
InModus deduktiv 
semantisch 


Abbildung 4.2: Modellierung von probabilistischen Attributen für die adaptive Umweltmodel- 
lierung (in UML Notation mit Multiplizitäten für Beziehungen). Ein Attribut 
wird dabei durch ein semantisches Netz repräsentiert. 


e Nominalskala < Ordinalskala < Intervallskala < Verhältnisskala, 
e Nominalskala < Ordinalskala < Absolutskala. 


Diese Halbordnung ist z.B. für die Festlegung des maximal unterstützten 
Skalenniveaus einer Qualität in einem Domänenmodell relevant. 


Szenarmodus Neben dem Skalenniveau ist auch eine weitere Eigenschaft 
von Qualitäten für die adaptive Umweltmodellierung von Interesse. Diese 
Eigenschaft betrifft die Art und Weise, wie Informationen über die konkrete 
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Ausprägung einer Qualität in einem beobachteten Objekt gewonnen wer- 
den können, und wird als Szenarmodus bezeichnet. Mit dieser Bezeichnung 
soll zum Ausdruck kommen, dass diese Eigenschaft vom konkreten Anwen- 
dungsszenario abhängt, genauer gesagt von der Sensorik, die einem gege- 
benen kognitiven System im Anwendungsfall zur Verfügung steht. Szenar- 
modi werden ebenfalls als einfache Symbole aus einem festen Wertevorrat 
repräsentiert. Ein perzeptiver Szenarmodus für eine Qualität beschreibt da- 
bei, dass im betrachteten Anwendungsfall entsprechende Ausprägungen der 
Qualität in beobachteten Objekten mittels der verfügbaren Sensorik wahr- 
genommen und ermittelt werden können. Ist eine solche Erfassung nicht 
möglich, so besitzt eine Qualität entweder einen deduktiven oder einen se- 
mantischen Szenarmodus. Ein semantischer Szenarmodus beschreibt, dass 
Werte für diese Qualität nur anhand des im Wissensmodell modellierten Vor- 
wissens gewonnen werden können. Ein deduktiver Szenarmodus beschreibt 
dahingegen, dass Ausprägungen für Objekte zwar nicht direkt beobachtet 
werden können, diese allerdings aus den Ausprägungen weiterer Qualitä- 
ten abgeleitet werden können, ggf. unter Betrachtung der Historie dieser 
Ausprägungen. 


Zustandsbezogene Qualitäten Eine weitere Eigenschaft von Qualitäten 
betrifft die Aussage, ob sie in Objekten einen Zustand beschreiben oder ein 
unveränderliches Merkmal darstellen. Ein unveränderliches Merkmal wird 
dabei als zeitlich konstant angenommen, ein Zustand kann sich im Verlauf 
der Zeitändern. Für Aufgaben wie eine Identifikation oder Klassifikation von 
in der Umgebung beobachteten Objekten ist eine derartige Unterscheidung 
von Interesse. So werden für diese Aufgaben im Allgemeinen unveränderli- 
che Merkmale genutzt. Auch für die Zuordnung von beobachteten Objekten 
zu Konzepten im Hintergrundwissen werden in der objektorientierten Um- 
weltmodellierung keine zustandsbezogenen Qualitäten eingesetzt. 
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Verwaltungsinformationen für Qualitäten Nicht dargestellt in Abbil- 
dung 4.2 sind als weitere Eigenschaften einer Qualität diejenigen Informa- 
tionen, welche als Parameterwerte für die probabilistische Informationsver- 
waltung von Qualitäten dienen. Dies sind z.B. ein Diskretisierungsparame- 
ter, welcher die Intervallgröße für die Diskretisierung eines stetigen Attri- 
buts dieser Qualität beschreibt, oder ein Alterungsfaktor, welcher zur proba- 
bilistischen Prädiktion einer Wahrscheinlichkeitsverteilung dieser Qualität 
verwendet werden kann. 


Schrittweise Spezifikation von Qualitäten Welche Qualitäten für eine 
Domäne und einen Anwendungsfall konkret betrachtet werden, wird in 
einem entsprechenden Domänenmodell festgelegt. In diesem Modell müs- 
sen pro Qualität auch Skalenniveau, Szenarmodus und Veränderlichkeit 
festgelegt werden. Diese Festlegung kann dabei schrittweise erfolgen: auf 
der Ebene eines Domänenmodells kann zunächst nur eine grobe Festlegung 
der Eigenschaften einer Qualität erfolgen, detaillierte Angaben können 
anschließend auf der Ebene eines untergeordneten Anwendungsmodells 
vorgenommen werden. Im in dieser Arbeit gewählten Vorgehen kann da- 
her z.B. das Skalenniveau einer Qualität auf zwei unterschiedliche Arten 
angegeben werden. Auf der Ebene eines Domänenmodells wird dabei für 
eine Qualität das maximal erlaubte Skalenniveau festgelegt, mit welchem 
Attribute zu dieser Qualität repräsentiert werden dürfen („erlaubtMaxSN“). 
Für einen konkreten Anwendungsfall kann dann das tatsächlich verwendete 
Skalenniveau spezifiziert werden („hatSN“), welches dem maximal erlaubten 
Skalenniveau im Sinne der zuvor beschriebenen Halbordnung untergeordert 
sein muss. In welchem Szenarmodus eine Qualität verwendet wird, wird 
im Regelfall ebenfalls erst für den konkreten Anwendungsfall festgelegt. 
In Abschnitt 4.5 wird auf diesen Aspekt der schrittweisen Erstellung von 
Hintergrundwissensmodellen nochmals eingegangen. 


Wahrscheinlichkeitsverteilungen 


Der zweite wichtige Aspekt bei der Darstellung von Attributen, neben der 
repräsentierten Qualität, ist die Beschreibung von unsicherheitsbehafteten 
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Attributwerten. Zu diesem Zweck werden DoB Wahrscheinlichkeitsvertei- 
lungen verwendet und mit einem Attribut verknüpft. Jeder Verteilung ist 
dabei ein bestimmter Wertebereich zugeordnet. In Abhängigkeit dieses Wer- 
tebereichs und ihres Skalenniveaus lassen sich verschiedene Arten von At- 
tributen unterscheiden. Auf die Details bzgl. der Repräsentation von unsi- 
cherheitsbehafteten Werten und die unterschiedlichen Arten von Attribu- 
ten wird im Abschnitt 4.3.2 genauer eingegangen. Beschreibt ein Attribut 
ein stetiges Merkmal, so muss neben einem reinen Zahlenwert auch dessen 
Maßeinheit angegeben werden. Dies gilt für deterministische Attributwerte 
genauso wie für probabilistische. Im in dieser Arbeit gewählten Vorgehen 
kann eine Wahrscheinlichkeitsverteilung daher eine Maßeinheit referenzie- 
ren. 


Maßeinheiten Einer Wahrscheinlichkeitsverteilung kann eine Maßeinheit 
zugeordnet werden. Aus Gründen der Interoperabilität werden in dieser Ar- 
beit für eine Qualität unterschiedliche Maßeinheiten unterstützt. Jede Ein- 
heit referenziert daher eine entsprechende Basiseinheit und gibt einen Um- 
rechnungsfaktor sowie einen Versatz an, welche zusammen beschreiben, wie 
diese Einheit unter Anwendung einer affinen Funktion in die Basiseinheit 
umgerechnet wird. 


4.3.2 Probabilistische Repräsentation von 
Attributwerten 


Nachdem vorausgehend die grundlegende Repräsentation von Attributen in 
der adaptiven Umweltmodellierung vorgestellt wurde, soll nun spezifisch 
die Darstellung unsicherheitsbehafteter Attributwerte betrachtet werden. In 
dieser Arbeit werden dazu verschiedene Arten von Attributen unterschie- 
den, hauptsächlich anhand der repräsentierten Skalenniveaus. Den unter- 
schiedlichen Arten von Attribut sind dabei analog unterschiedliche Typen 
von Wahrscheinlichkeitsverteilungen zugeordnet. 


Arten von probabilistischen Attributen Als Attribute werden zunächst 
diskrete von stetigen Attributen unterschieden, in Bezug auf die verschie- 
denen Arten von repräsentierten Merkmalen. Als diskrete Attribute werden 
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Diskretes Attribut 


- Diskrete WV 


- Wahrscheinlichkeits- 
verteilung (WV) 


Absolutes 
Attribut 


- Ganzzahlen-WV - Enumerations-WV 


Stetiges Attribut 


- Stetige WV 


A 


Verhältnisskaliertes 
Attribut 


Intervallskaliertes 
Attribut 


Abbildung 4.3: Definierte Arten von probabilistischen Attributen in der adaptiven Umweltmo- 
dellierung. Attribute werden anhand ihrer Skalenniveaus unterschieden und 
sind mit Bezug zum für sie genutzten Typ von Wahrscheinlichkeitsverteilung 
dargestellt (Erweiterung zu [Kuw13c]). 


absolute, nominale und ordinale Attribute unterscheiden, welche jeweils die 


entsprechenden Skalenniveaus repräsentieren. Nominale und ordinale At- 


tribute werden zu qualitativen Attributen zusammengefasst. Als stetige At- 
tribute sind intervall- und verhältnisskalierte Attribute definiert. Abbildung 
4.3 stellt die im Metamodell definierten Arten von Attributen dar. In Abbil- 
dung 4.4 werden die definierten Typen von Wahrscheinlichkeitsverteilun- 


gen gezeigt. 


Typen von Wahrscheinlichkeitsverteilungen Für Wahrscheinlichkeits- 


verteilungen sind ebenfalls diskrete und stetige Typen definiert. Als diskrete 
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Wahrscheinlichkeitsverteilung (WV) 


- Wertebereich 


Diskrete WV Stetige WV 


- Diskreter Wertebereich - Kont. Wertebereich 


Enumerations-WV Ganzzahlen-WV 


- Enumeration - Diskretes Intervall 


Mischverteilung 


Binäre WV 


- {Wahr, Falsch} 


seen Gaußmischverteilung 


Abbildung 4.4: Definierte Typen von Wahrscheinlichkeitsverteilungen in der adaptiven Um- 
weltmodellierung und ihre Wertebereiche (nach [Kuw13c]). 


Wahrscheinlichkeitsverteilungen sind Verteilungen über den ganzen Zah- 
len Z als ihrem Wertebereich und über symbolischen Enumerationen als 
Wertebereich definiert. Diese Verteilungen werden entsprechend von abso- 
luten bzw. qualitativen Attributen referenziert. Als stetige Verteilungen wer- 
den unimodale Verteilungen und Mischverteilungen unterschieden, welche 
beide von intervall- oder verhältnisskalierten Attributen referenziert wer- 
den können. Konkret sind Normalverteilungen als unimodale Verteilungen 
sowie Gaußmischverteilungen definiert. Weiterhin können als unimodale 
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Verteilungen abgeschnittene Versionen der Normalverteilung tiber relevan- 
ten Einschränkungen der reellen Zahlen als Wertebereiche genutzt werden, 
z.B. positive bzw. nicht-negative Normalverteilungen. 


In Abbildung 4.5 sind zwei Beispiele dafür dargestellt, wie ein probabilisti- 
sches Attribut in der adaptiven Umweltmodellierung konkret repräsentiert 
wird. Als Attribut wird dabei eine Anzahl bzw. eine binäre Existenzvaria- 
ble dargestellt. Konzepte werden als gelbe Ellipsen gezeigt, Instanzen dieser 
Konzepte als rote Rechtecke. Die Werte des Anzahlattributs werden durch 
eine diskrete Wahrscheinlichkeitsverteilung über den ganzen Zahlen reprä- 
sentiert, welche nur für die zwei gezeigten Elemente (Zahlen) eine von Null 
verschiedene Wahrscheinlichkeit annimmt. Die Existenzvariable wird über 
einer binären Enumeration repräsentiert, deren Symbolen Wahrscheinlich- 
keiten zugeordnet werden. 


4.3.3 Probabilistische Repräsentation von Beziehungen 


In der objektorientierten Umweltmodellierung werden neben Attributen 
von Entitäten auch die Beziehungen zwischen Entitäten auf eine probabilis- 
tische Weise repräsentiert [Bey07, Ghe10b, Hei10]. Anforderungen an solche 
probabilistische Relationen existieren in Vorarbeiten zur objektorientierten 
Umweltmodellierung nur vage als die folgenden Aussagen: 


e Relationen besitzen ebenfalls Attribute, und diese Attribute werden 
probabilistisch repräsentiert [Bey07], 


e Relationen werden als binäre Variablen [Ghe10a] und analog zu Attri- 
buten [Ghe10b, Hei10] behandelt. 


Mit diesen Aussagen wird insgesamt beschrieben, dass Relationen einerseits 
ebenfalls probabilistisch repräsentierte Attribute besitzen und andererseits 
die Existenz einer konkreten Beziehung zwischen zwei Entitäten auch als 
unsicher betrachtet und über eine binäre Variable repräsentiert wird. Diese 
Variable kann dabei durch ein Attribut dargestellt werden. 
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5 3 is-a 5 instance-of 
DiskretesAttribut D< AbsolutesAttribut AbsAtt#1_Anzahl 


T 
1 
I 
thatVerteilung 
I 


is-a instance-of 
Ganzzahl-WV#1_Anzahl 


T T 
hatElement! ihatElement 
I I 
1 1 
ee ee | 
Vv 
stance Elem#1_Anzahl-3 Elem#2_Anzahl-4 
GanzzahlenWV-Element ii 
P 0.2 p: 0.8 
instance-of 


(a) Probabilistisches Attribut für eine Anzahl. 


z 7 is-a = 7 instance-of A y 
NominalesAttribut D< BinäresAttribut BinAtt#1_Existenz 


hatVerteilung 


F is-a ; instance-of . j 
Enumerations-WV D<  Binärewv > BinWV#1_Existenz 
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1 
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1 
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g 
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3 
® 
| 
Oo 
g 


‘natTeil atTeil 


is-a 
BinärEnumSymbol> Wahr_Symbol Falsch_Symbol 
i instance-of 


instance-of 


(b) Probabilistisches Attribut fiir eine Existenzvariable. 


Abbildung 4.5: Beispiel fiir die Darstellung eines probabilistischen Attributs in der Metamo- 
dellierung fiir die adaptive Umweltmodellierung. Als Qualitaten werden eine 
Anzahl (a) und Existenzvariable (b) reprasentiert. Gelbe Ellipsen stellen dabei 
Konzepte dar, rote Rechtecke Instanzen. 
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Aus der Notwendigkeit heraus, dass probabilistische Relationen in der ob- 
jektorientierten Umweltmodellierung über Attribute verfügen müssen, er- 
geben sich Konsequenzen für die formale Darstellung solcher Relationen in 
einer Wissensreprasentationssprache. So können in OWL z.B. nicht direkt 
Attribute für Beziehungen dargestellt werden. Weiterhin können auch nur 
binäre Beziehungen, d.h. Beziehungen zwischen maximal zwei Entitäten, 
repräsentiert werden. Eine Möglichkeit, mit diesen Einschränkungen umzu- 
gehen, besteht in der Reifikation’ von Relationen, d.h. ihrer Darstellung (in 
OWL) als ein Konzept. Diesem Konzept können dann, wie benötigt, proba- 
bilistische Attribute zugeordnet werden. 


Über diese Aussagen hinaus werden in dieser Arbeit die folgenden Betrach- 
tungen zugrunde gelegt. In einem Domänenmodell der objektorientierten 
Umweltmodellierung dient die Festlegung von probabilistischen Relationen 
zwei unterschiedlichen Zwecken. Im ersten Fall soll eine Terminologie spezi- 
fiziert werden, unter Verwendung derer im Weltmodell dann die konkreten, 
z.B. aufgrund von Beobachtungen inferierten Beziehungen zwischen Entitä- 
ten beschrieben werden können. Zum zweiten dienen Relationen, gleich ob 
deterministischer oder probabilistischer Natur, der Modellierung von Vor- 
wissen über die Entitäten einer Domäne. In beiden Fällen können domänen- 
unabhängige Aspekte bzgl. der Repräsentation von probabilistischen Rela- 
tionen bereits in der Metamodellierung festgelegt werden, z.B. was die Un- 
terscheidung unterschiedlicher Arten von probabilistischen Relationen an- 
geht. Die beiden dargelegten Fälle unterscheiden sich in einem wesentlichen 
Aspekt bzgl. der Wissensrepräsentation: im ersten Fall, der Repräsentation 
von konkreten Beziehungen z.B. zwischen Objekten einer betrachteten Um- 
gebung, werden Relationen zwischen Instanzen beschrieben. Konkret be- 
trifft dieser Fall Beziehungen zwischen Repräsentanten in der Weltmodell- 
Komponente. Im zweiten Fall, der Modellierung von Vorwissen, müssen Be- 
ziehungen dargestellt werden, die zwischen Typen von Entitäten gelten, re- 
präsentiert durch die Konzepte des Hintergrundwissens. Hier sind also kei- 
ne Instanzen betroffen, sondern es wird allgemeines Wissen repräsentiert 


1 Vergegenständlichung, von lateinisch „res“, die Sache, und „facere“, machen 
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in Form von Restriktionen an Konzepte. Ein Metamodell für das Hinter- 
grundwissen der objektorientierten Umweltmodellierung muss die Darstel- 
lung beider Arten von Relationen berücksichtigen und ermöglichen. 


Arten von relationsbezogenen Unsicherheiten In der Literatur z.B. zu 
logisch-probabilistischen Repräsentationssprachen (vgl. Abschnitt 2.2.4) 
werden verschiedene Arten von Unsicherheiten unterschieden. Unsicher- 
heiten, die die Beziehungen zwischen Entitäten betreffen, werden dabei 
als strukturelle Unsicherheiten bezeichnet [Kol98]. Diese Benennung liegt 
darin begründet, dass die gegebenen Beziehungen die Struktur eines pro- 
babilistisch graphischen Modells bestimmen. Innerhalb der strukturellen 
Unsicherheiten können folgende Typen unterschieden werden [Kol98, 
How09]: 


« Die Existenz-Unsicherheit beschreibt für Relationen die Frage, ob 
und mit welcher Wahrscheinlichkeit eine Beziehung zwischen zwei 
Entitäten tatsächlich existiert. Sie deckt sich ihrer Art nach mit der 
in der objektorientierten Umweltmodellierung postulierten Existenz- 
wahrscheinlichkeit für probabilistische Relationen. 


« Die Anzahl-Unsicherheit beschreibt Unsicherheit bzgl. der Frage, mit 
wie vielen anderen Entitäten (eines gegebenen Typs) eine bestimmte 
Entität in Beziehung steht. 


e Die Referenz-Unsicherheit beschreibt schließlich die Frage, mit welcher 
Wahrscheinlichkeit eine Entität mit den Entitäten einer gegebenen 
Menge in Beziehung steht. 


In dieser Arbeit werden alle drei Arten von strukturellen Unsicherheiten für 
die objektorientierte Umweltmodellierung als relevant betrachtet. Existenz- 
Unsicherheit betrifft sowohl konkrete Beziehungen im Weltmodell als auch 
Vorwissen ausdrückende Beziehungen im Hintergrundwissen. Die entspre- 
chende Unsicherheit kann mittels einer binären Zufallsvariablen im Sinne 
einer Existenzwahrscheinlichkeit dargestellt werden. Anzahl-Unsicherheit 
wird in dieser Arbeit nur in Bezug auf Vorwissen betrachtet, da bei die- 
ser Art der strukturellen Unsicherheit keine konkreten Instanzen angege- 
ben werden. Die entsprechende Unsicherheit kann mittels einer diskreten 
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Zufallsvariablen auf absolutem Skalenniveau dargestellt werden, z.B. über 
den natürlichen Zahlen als Wertebereich. 


Referenz-Unsicherheit betrifft wiederum konkrete Instanzen und wird in 
dieser Arbeit nur in Bezug auf das Weltmodell betrachtet. Die entspre- 
chende Unsicherheit kann mittels einer diskreten Zufallsvariablen über 
einer gegebenen Menge von Instanzen und auf nominalem Skalenniveau 
dargestellt werden. Eine gewisse Art von Referenz-Unsicherheit in Bezug 
auf Konzepte im Hintergrundwissen kann durch die mehrmalige Model- 
lierung einer probabilistischen Relation für das gleiche Ausgangskonzept 
zu unterschiedlichen Zielkonzepten modelliert werden - vorausgesetzt, 
dies stellt für den betroffenen Typ von Relation eine semantisch sinnvolle 
Aussage dar. So kann, als Beispiel aus der Haushaltsdomäne, eine proba- 
bilistische Enthaltenseins-Relation zwischen einem Konzept Messer und 
einem Konzept Schublade modelliert werden, um auszudrücken, dass sich 
mit spezifizierter Wahrscheinlichkeit eine Instanz des Konzepts Messer in 
einer Instanz des Konzept Schublade befindet. Zugleich kann über eine 
weitere probabilistische Enthaltenseins-Relation mit dem Ausgangskonzept 
Messer modelliert werden, dass sich eine Messer-Instanz mit gegebener 
Wahrscheinlichkeit in einer Spülmaschinen-Instanz befinden kann. Auf 
diese Weise lässt sich eine Art der Referenz-Unsicherheit auf der Ebene 
von Konzepten modellieren. Da jeweils keine konkreten Instanzen betrof- 
fen sind, muss sich durch die modellierten Wahrscheinlichkeiten für das 
Ausgangskonzept bzgl. der Relation nicht notwendigerweise eine normierte 
Wahrscheinlichkeitsverteilung ergeben. 


Arten von probabilistischen Relationen Für die objektorientierte Um- 
weltmodellierung werden daher die in Abbildung 4.6 dargestellten Arten 
von probabilistischen Relationen unterschieden. Jede Art referenziert dabei 
verschiedene probabilistische Attribute zu unterschiedlichen Qualitäten. In 
dieser Arbeit werden probabilistische Relationen reifiziert als Konzept mo- 
delliert, um ihnen Attribute zuordnen zu können. Das Basiskonzept für pro- 
babilistische Relationen definiert dabei zunächst eine Existenzwahrschein- 
lichkeit als binäres Attribut. Weiterhin besitzt jede probabilistische Relati- 
on ein Ausgangselement (Konzept oder Instanz), für welches die Relation 
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Abbildung 4.6: Detaillierte Modellierung von probabilistischen Relationen (Beziehungen in 
UML Notation mit Multiplizitaten angegeben). 


gilt, sowie ein Zielelement. Zur Darstellung von Anzahl-Unsicherheit wird 
das Basiskonzept erweitert durch ein Konzept fiir probabilistische Anzahl- 
Relationen. Anzahl-Relationen definieren ein probabilistisches Attribut fiir 
die Qualität Anzahl. Zur Darstellung von Referenz-Unsicherheit wird eben- 
falls das Basiskonzept erweitert, und zwar durch ein Konzept fiir probabilis- 
tische Mengenrelationen. Diese werden über ein Attribut der Qualität Aus- 
wahl beschrieben. Eine Auswahl stellt dabei abstrakt eine Enumeration von 
verschiedenen Symbolen dar, wobei diese Symbole z.B. Instanzen, also Re- 
präsentanten im Weltmodell, referenzieren können. Probabilistisch wird die- 
se Auswahl über ein entsprechendes qualitatives Attribut beschrieben. Die 
Symbole können weiterhin auch Konzepte referenzieren. Auf diese Weise 
kann eine probabilistische Typzuordnung von Repräsentanten zu Konzep- 
ten im Hintergrundwissen repräsentiert werden (vgl. Kapitel 6). 
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Typen von Relationen Neben diesen Arten von probabilistischen Relatio- 
nen müssen weiterhin, quasi orthogonal zu den Arten, verschiedene Typen 
von Beziehungen unterschieden werden, welche probabilistisch repräsen- 
tiert werden sollen. Zu diesem Zweck wird ein Konzept für typisierte pro- 
babilistische Relationen definiert, unter welchem dann die konkreten Typen 
von Beziehungen z.B. für eine Anwendungsdomäne einzuordnen sind. Für 
jeden Typ von Beziehung kann dabei auch der zulässige Definitions- und 
Wertebereich angegeben werden. Weiterhin kann pro Typ einer Relation 
auch ein spezifischer Alterungsfaktor für die probabilistische Informations- 
verarbeitung angegeben werden, welcher das Absinken der Existenzwahr- 
scheinlichkeit von Instanzen dieses Relationstyps über der Zeit beschreibt. 


In Abbildung 4.7 sind zwei Beispiele für probabilistische Relationen darge- 
stellt. Diese ergeben sich anhand der gewählten Metamodellierung ebenfalls 
als semantische Netze. Gelbe Ellipsen stellen dabei wieder Konzepte dar und 
rote Rechtecke Instanzen. In Abbildung 4.7a wird eine probabilistische Basis- 
relation gezeigt vom Typ „IstIn“, also eine Enthaltenseins-Relation. Die ge- 
zeigte Relation könnte so z.B. zwischen Repräsentanten in der Weltmodell- 
Komponente bestehen. Als probabilistische Relation besitzt die Relation eine 
Qualität Existenz mit einem binären Attribut. Ausgangselement der Relati- 
on ist eine Instanz des Konzepts Messer, Ziel ist eine Instanz des Konzepts 
Schublade. In Abbildung 4.7b wird eine probabilistische Relation vom Typ 
„hatTeil“ gezeigt, also eine Teile-Ganzes-Beziehung. Die Relation ist der Art 
ihrer Unsicherheit nach eine probabilistische Anzahlrelation und könnte in 
der gezeigten Form als ein Teil eines Hintergrundwissensmodells dienen. Als 
Ausgangselement wird das Konzept Stuhl mit dem Ziel-Konzept Möbelbein 
in Beziehung gesetzt. Die Qualität Anzahl beschreibt dabei über ihr absolu- 
tes Attribut wie wahrscheinlich es a priori ist, dass ein Stuhl eine bestimmte 
Anzahl von Beinen als Teile besitzt. 


Szenarmodus von Relationen Neben Qualitäten lassen sich auch Relatio- 
nen bzgl. der Art ihrer Verwendung in einem Anwendungsfall unterschei- 
den. Zu diesem Zweck können die für Qualitäten definierten Szenarmodi 
verwendet werden. Diese lassen sich dabei auf die zuvor genannten Zwecke 
von Relationen abbilden. 
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(b) Probabilistische Anzahl-Relation vom Typ „hatTeil“. 


Abbildung 4.7: Beispiel für die Darstellung von probabilistischen Relationen in der adapti- 
ven Umweltmodellierung. Es wird eine probabilistische Relation mit Existenz- 
wahrscheinlichkeit (a) sowie eine probabilistische Anzahlrelation (b) gezeigt. 
Gelbe Ellipsen stellen dabei Konzepte dar, rote Rechtecke Instanzen. Die pro- 
babilistischen Attribute werden der Übersicht halber verkürzt als Knoten und 
nicht als semantische Netze dargestellt (die Netze entsprechen ihrer Art nach 
den in Abbildung 4.5 gezeigten). 
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Relationen mit semantischem Szenarmodus (kurz: semantische Relationen) 
dienen im Anwendungsfall zur Modellierung von Vorwissen im Hinter- 
grundwissensmodell. Derartige Relationen können i.A. nicht oder nur 
bedingt aus Informationen im Weltmodell abgeleitet werden. Perzeptive 
und deduktive Relationen beschreiben dagegen konkrete Beziehungen 
zwischen Repräsentanten im Weltmodell. Dabei sind Relationen häufig 
deduktiv. Dies bedeutet, dass über ihr Vorliegen aufgrund der Attribute 
von Repräsentanten entschieden wird. Relationen mit unterschiedlichem 
Szenarmodus erfordern eine unterschiedliche Behandlung in der Informa- 
tionsverwaltung. Um diese Unterscheidung zu ermöglichen, können im 
Hintergrundwissen Konzepte für typisierte Relationen entsprechend mit 
ihrem Szenarmodus annotiert werden. Auf die Szenarmodi von Relatio- 
nen wird weiterhin in Abschnitt 5.3.4 eingegangen in Verbindung mit der 
Erzeugung von Relationen in der Informationsverwaltung. 


4.4 Strukturierung der Konzepte des 
Hintergrundwissens 


Das objektorientierte Umweltmodell kann in unterschiedlichen Anwen- 
dungsdomänen eingesetzt werden. Jede Domäne erfordert ein angepasstes 
Wissensmodell, welches die für die Domäne relevanten Entitäten und 
Beziehungen sowie deren Bedeutung beschreibt. All diesen Wissensmo- 
dellen muss jedoch ein gemeinsamer Satz von Prinzipien zugrunde gelegt 
werden. Dies ist eine Voraussetzung, um übergeordnete Anteile der ob- 
jektorientierten Umweltmodellierung, wie die Informationsverwaltung im 
Weltmodell oder eine adaptive Anpassung des Hintergrundwissens, domä- 
nenunabhängig beschreiben zu können. Auch ist Interoperabilität zwischen 
verschiedenen Domänenmodellen auf semantischer Ebene erforderlich. 
Zu einem gewissen Anteil kann dies durch die Vorgaben eines Metamo- 
dells erreicht werden. Im in Kapitel 4.3 vorgestellten Metamodell werden 
allerdings bisher nur spezifische Fragestellungen der objektorientierten 
Umweltmodellierung betrachtet. Zu allgemeinen Fragestellungen der Wis- 
sensmodellierung und formalen Ontologie werden dort keine Festlegungen 
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getroffen. Eine solche, sehr relevante Fragestellung betrifft die grundlegen- 
de kategorische Strukturierung, unter welcher die Welt und mit ihr die zu 
modellierenden Domänen betrachtet und repräsentiert werden. 


Eine solche Strukturierung wird in Top-Level Ontologien festgelegt, welche 
dazu entsprechende Kategorien als Konzepte definieren. Domänenmodelle, 
die eine solche Strukturierung respektieren wollen, können dann als eine Er- 
weiterung dieser Top-Level Ontologie erstellt werden. Erfolgt die Definition 
einer Top-Level Ontologie mit einer entsprechend ausdrucksstarken Axio- 
matisierung, so kann ein hoher Grad an Interoperabilität zwischen unter- 
schiedlichen, als Erweiterungen dieser Ontologie erstellten Domänenmodel- 
len erreicht werden. Diesem grundsätzlichen Ansatz folgend wird in dieser 
Arbeit die Ontologie DOLCE [Mas03] als Top-Level Ontologie zur kategori- 
schen Strukturierung von Vorwissen für Domänenmodelle der objektorien- 
tierten Umweltmodellierung eingesetzt. 


we 


is-a 


ParasitäreEntität 


Abbildung 4.8: Grundlegende Strukturierung von Kategorien in der Top-Level Ontologie 
DOLCE [Mas03] in der Version von DOLCE Lite. 
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4.4.1 Wissensstrukturierung in DOLCE 


DOLCE wurde als eine beschreibende Ontologie entwickelt, welche sich in 
ihrer grundlegenden Art, wie sie die Welt betrachtet, an der menschlichen 
Sprache und Kognition orientiert [Mas03]. Fiir die entwickelte Strukturie- 
rung von Wissen spiegelt sich dies in grundlegenden Kategorien wider, die 
sich auf der Ebene der menschlichen Wahrnehmung und des menschlichen 
Alltagsdenkens wiederfinden. In Bezug auf Erweiterbarkeit ist DOLCE ex- 
plizit darauf ausgelegt, als Startpunkt für die Entwicklung von Domänen- 
Ontologien zu dienen [Mas03]. 


Die grundlegende Taxonomie von Kategorien in DOLCE ist in Abbildung 
4.8 dargestellt. Die Abbildung zeigt dabei einen Ausschnitt der Taxonomie 
mit leichten Anpassungen, wie sie in der OWL-Version DOLCE Lite! umge- 
setzt sind. DOLCE unterscheidet grob zwischen Entitäten mit Raumzeitbe- 
zug („RaumZeitEntität“) und abstrakten Entitäten. Abstrakte Entitäten besit- 
zen dabei weder räumliche noch zeitliche Qualitäten. Qualitäten sind selbst 
als raumzeitliche Entitäten modelliert. Sie stellen dabei Basis-Entitäten dar, 
die wahrgenommen oder gemessen werden können [Mas03], wie z.B. die 
Farbe eines Gegenstandes oder dessen Länge. Als weitere raumzeitliche En- 
titäten werden Enduranten von Perduranten unterschieden. 


Entitäten, welche zu jedem Zeitpunkt vollständig existieren, werden dabei 
als Enduranten bezeichnet. Entitäten, welche hingegen nur in der Zeit bzw. 
über die Zeit hinweg existieren, also zu jedem einzelnen Zeitpunkt nicht 
vollständig existieren, werden als Perduranten bezeichnet. Als unterschied- 
liche Perduranten werden z. B. Ereignisse, Phänomene und verschiedene Ar- 
ten von Vorgängen modelliert. Für Enduranten wird zwischen physischen 
und nichtphysischen Enduranten unterschieden. Physische Enduranten sind 
dabei Objekte (im Sinne von Gegenständen), Mengen von Stoffen (z.B. ein 
Liter Wasser) und sog. parasitäre Entitäten. Parasitäre Entitäten stellen be- 
stimmte Eigenschaften oder Merkmale von physischen Enduranten dar, wie 


* http://www.loa.iste.cnr.it/old/ontologies/DLP3971.zip 
(letzter Abruf: 08.05.2020) 
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die Kante eines Tisches oder Aussparungen wie die Löcher einer Steckdose. 
Nichtphysische Enduranten sind Entitäten, die keine direkten physischen 
Qualitäten besitzen (wie z.B. einen Ortsbezug oder eine Masse). Allerdings 
benötigen diese Entitäten einen physischen Enduranten als ihren konstitu- 
ierenden Bestandteil. Nichtphysische Enduranten stellen somit eine Form 
der Indirektion dar, die es erlaubt, physische Objekte von den Rollen, die 
sie erfüllen, unterscheiden zu können. So kann z.B. eine soziale Rolle wie 
Präsident von der menschlichen Person, die diese Rolle erfüllt, unterschie- 
den werden. Für physische sowie nichtphysische Objekte werden weiterhin 
Agenten, d.h. handelnde Subjekte, von reinen, nicht handelnden Objekten 
unterschieden. Die Festlegung und Unterscheidung dieser grundlegenden 
Kategorien in DOLCE basiert insgesamt auf Prinzipien der formalen Onto- 
logie, wie sie z.B. auch in der OntoClean Methodik [Gua02] zur Erstellung 
von Taxonomien angewendet werden. 


Qualitäten Viele der genannten Kategorien in DOLCE lassen sich anhand 
der Arten von Qualitäten unterscheiden, welche sie besitzen. Qualitäten stel- 
len in DOLCE als raumzeitliche Entitäten einen eigenen Zweig der Taxono- 
mie dar. Dieser Zweig kann in Domänenmodellen erweitert werden. Grund- 
sätzlich werden in DOLCE physische Qualitäten von zeitlichen und abstrak- 
ten Qualitäten unterschieden, analog zur Unterscheidung der entsprechen- 
den Kategorien. Jeder Qualität ist dabei ein Wertebereich, eine sog. Region 
zugeordnet, welche als abstrakte Entität modelliert ist. Der Wert der Qualität 
eines Objektes wird in DOLCE indirekt modelliert: jedes konkrete Objekt be- 
sitzt für einen gegebenen Typ von Qualität eine konkrete Ausprägung (z.B. 
die Länge des Esstisches), welcher ein spezifischer (z. B. numerischer) Wert 
innerhalb der Region der Qualität zugeordnet ist. Somit wird eine konkrete 
Eigenschaft eines Objekts in DOLCE als ein semantisches Netz modelliert. 
Abbildung 4.9 zeigt ein Beispiel dafür, wie diesem Ansatz folgend eine Ei- 
genschaft eines Objekts (deterministisch) in einer Wissensbasis beschrieben 
werden kann. Eine Entität steht dabei über Relationen mit denjenigen Qua- 
litäten in Beziehung, welche sie aufweist. Die Qualitäten stehen wiederum 
mit ihren Regionen in Beziehung, welche die möglichen Werte der Qualität 
enthält und eine spezifische Strukturierung aufweisen kann [Mas03]. Eine 
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Abbildung 4.9: Darstellung der Eigenschaften von Objekten in DOLCE. Konkrete Eigenschaf- 
ten werden dabei in Form von semantischen Netzen repräsentiert. Gelbe EI- 
lipsen stellen in der Abbildung Konzepte dar, während rote Rechtecke deren 
Instanzen repräsentieren. 


Qualität steht weiterhin mit sog. Qualia' in Beziehung, über welche der kon- 
krete Wert einer Qualität als eine atomare Position innerhalb der Qualitäts- 


region beschrieben wird. 


4.4.2 Integration des Metamodells in DOLCE 


Die grundlegende Taxonomie der Top-Level Ontologie DOLCE wird in die- 
ser Arbeit zur Strukturierung von Hintergrundwissensmodellen der objekt- 
orientierten Umweltmodellierung genutzt. Um dies praktisch zu ermögli- 
chen, muss das in Abschnitt 4.3 vorgestellte Metamodell in DOLCE integriert 
werden. Zu diesem Zweck wurde das Metamodell formal in OWL modelliert 
und in DOLCE Lite, der OWL-Version von DOLCE, integriert’. 


* Singular: Quale 

2 Es lassen sich nicht alle Axiome von DOLCE in OWL DL ausdrücken, daher stellt die OWL- 
Variante eine „Lite“-Version von DOLCE dar. Diese wird beschrieben und bereitgestellt unter: 
http://www.loa.iste.cnr.it/dolce/overview.html (letzter Abruf: 08.05.2020). 
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Als Ergebnis wurde eine Kern-Ontologie für die objektorientierte Umwelt- 
modellierung geschaffen, die in OWL 2 DL als Repräsentationssprache dar- 
gestellt ist. Die Integration des Metamodells betrifft dabei im Wesentlichen 
zwei Aspekte: einerseits muss die Darstellung von probabilistischen Attri- 
buten ermöglicht werden, andererseits die Repräsentation von probabilisti- 
schen Relationen. 


Probabilistische Attribute Für die Integration von probabilistischen At- 
tributen müssen zusätzliche Konzepte des Metamodells in DOLCE definiert 
werden, welche zur Darstellung von unsicherheitsbehafteten Informationen 
sowie zur Darstellung der Eigenschaften von Qualitäten notwendig sind. Das 
Konzept Qualität kommt an sich sowohl im Metamodell als auch in DOLCE 
vor. Die Darstellung des Konzepts im Metamodell ist dabei kompatibel zur 
DOLCE Kategorie für Qualitäten, so dass keine Anpassung notwendig ist. 
Auf der Ebene eines Domänenmodells modellierte Qualitäten können somit 
direkt unterhalb der DOLCE Kategorie für Qualitäten eingehängt werden. 


Die weiteren notwendigen Konzepte zur Modellierung von probabilistischen 
Attributen werden als abstrakte Entitäten in DOLCE eingebunden. Dies be- 
trifft die unterschiedlichen Arten von Attributen, die unterschiedlichen Ty- 
pen von Wahrscheinlichkeitsverteilungen sowie Konzepte, die zur Darstel- 
lung von Wertebereichen notwendig sind. Zur Modellierung der im Meta- 
modell definierten Eigenschaften von Qualitäten werden Konzepte zur Re- 
präsentation der unterschiedlichen Szenarmodi einer Qualität und zur Dar- 
stellung von Skalenniveaus jeweils als abstrakte Entitäten definiert. 


Weiterhin müssen auch die Beziehungen integriert werden, welche für eine 
Repräsentation von probabilistischen Attributen als semantische Netze not- 
wendig sind, um die eben genannten Konzepte in Beziehung zu setzen. Zu 
diesem Zweck werden die benötigten Typen von Relationen als OWL Ob- 
jektbeziehungen' modelliert. Dies betrifft z.B. die Relationen zwischen ei- 
nem konkreten Attribut und seiner Wahrscheinlichkeitsverteilung oder zur 
dargestellten Qualität. Einfache Eigenschaften von Qualitäten, welche direkt 
als Zahlenwerte oder Wahrheitswerte repräsentiert werden können, werden 


Englisch: object properties 
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als OWL Dateneigenschaften’ modelliert. Dies betrifft z.B. Zahlenwerte zur 
Beschreibung von Wahrscheinlichkeiten oder von Parametern der probabi- 
listischen Informationsverwaltung wie Alterungsfaktoren. 


Probabilistische Relationen Das in dieser Arbeit vorgestellte Metamo- 
dell beriicksichtigt auch probabilistische Relationen. In DOLCE werden sol- 
che Relationen nicht per se unterstützt. Für die Integration von probabilisti- 
schen Relationen in die Kern-Ontologie müssen daher ebenfalls zusätzliche 
Konzepte und Objektbeziehungen definiert werden. Die zusätzlichen Kon- 
zepte betreffen dabei die Darstellung der unterschiedlichen Arten von pro- 
babilistischen Relationen sowie von typisierten Relationen. Diese werden in 
dieser Arbeit als raumzeitliche Entitäten in die DOLCE Taxonomie einge- 
ordnet, da probabilistische Relationen potenziell Attribute für räumliche so- 
wie zeitliche Qualitäten besitzen können. Die bereits im Metamodell festge- 
legten Unterklassen-Beziehungen zwischen diesen zusätzlichen Konzepten 
werden beibehalten. Analog zum Vorgehen bei probabilistischen Attributen 
werden in dieser Arbeit die Beziehungen zwischen diesen Konzepten, die 
zur Darstellung probabilistischer Relationen zusätzlich notwendig sind, als 
OWL Objektbeziehungen modelliert. Typspezifische Alterungsfaktoren für 
probabilistische Relationen können unter Verwendung der bereits für Attri- 
bute definierten Dateneigenschaft angegeben werden. 


Maßeinheiten Auch die zusätzlich notwendigen Konzepte zur Darstel- 
lung von Maßeinheiten für probabilistische Attribute werden als abstrakte 
Entitäten modelliert. Ebenfalls werden die im Metamodell definierten Bezie- 
hungen zu Basis-Einheiten als Objektbeziehungen und die benötigten Infor- 
mationen für eine Konvertierung zwischen unterschiedlichen Einheiten als 
Dateneigenschaften modelliert. In der Kern-Ontologie der objektorientier- 
ten Umweltmodellierung selbst werden dabei nur wenige konkrete Einhei- 
ten modelliert, z.B. Längeneinheiten. Auf der Ebene eines Domänenmodells 
können dann weitere konkrete Einheiten für die Qualitäten eines Anwen- 
dungsfalls modelliert werden. Die Einheiten werden, analog zum Vorgehen 
bei der Definition domänenspezifischer Qualitäten, in einem eigenen Zweig 


Englisch: data properties 
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der Taxonomie dargestellt. In diesem Zusammenhang ist auch die grund- 
sätzliche Erweiterbarkeit der Kern-Ontologie bezüglich Maßeinheiten von 
Relevanz. Allgemein ist eine Anbindung oder zumindest eine teilweise Ver- 
wendung von existierenden Ontologien für Einheiten empfehlenswert. Ein 
Beispiel für eine solche Ontologie ist die in Abschnitt 2.3.2 genannte On- 
tologie für Maßeinheiten [Rij13]. Um eine solche Einbindung realisieren zu 
können, kann zunächst die Ausrichtung’ oder Abbildung? des einzubinden- 
den Modells auf die Kern-Ontologie der Umweltmodellierung notwendig 
sein. So ist z.B. die genannte Ontologie für Maßeinheiten bisher nicht di- 
rekt mit der Top-Level Ontologie DOLCE kompatibel, vor allem in Bezug 
auf die Modellierung von Qualitäten [Rij13]. Eine Übernahme relevanter 
Informationen zumindest in Bezug auf die modellierten Einheiten und ih- 
rer Konvertierungsfaktoren in ein Domänenmodell für die objektorientierte 
Umweltmodellierung sollte aber dennoch prinzipiell möglich sein. Eine wei- 
tere Untersuchung dieses Aspekts liegt allerdings außerhalb des Rahmens 
dieser Arbeit. Alternativ können existierende Modelle auch genutzt werden, 
um erfasste Größen zu beobachteten Objekten vorab, d.h. vor dem Einspei- 
sen in das objektorientierte Umweltmodell, in unterstützte Einheiten um- 
zurechnen. 


4.4.3 Kern-Ontologie für die objektorientierte 
Umweltmodellierung 


Durch die formale Darstellung des definierten Metamodells in OWL und 
dessen Integration unterhalb der Top-Level Ontologie DOLCE konnte eine 
Kern-Ontologie für die objektorientierte Umweltmodellierung erstellt wer- 
den. Diese Ontologie soll als Ausgangspunkt dienen, um spezifische Model- 
le für entsprechende Domänen und Anwendungsfälle der objektorientierten 
Umweltmodellierung zu definieren. Ein Vorgehen zur Erstellung solcher Do- 
mänenmodelle wird in Abschnitt 4.5 diskutiert. Neben den bisher genannten, 


* Englisch: alignment 
* Englisch: mapping 
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zumeist aus der Metamodellierung resultierenden Eigenschaften der Kern- 
Ontologie zeichnet sich diese noch durch weitere Eigenschaften aus, die sich 
zum Teil aus der Verwendung von DOLCE als Top-Level Ontologie ergeben. 
Diese sollen nachfolgend betrachtet werden. 


Definierte Relationen Neben einer Taxonomie von Kategorien werden 
in DOLCE ebenfalls grundlegende Typen von Beziehungen definiert und als 
OWL Objektbeziehungen modelliert. Diese beinhalten die bereits genannten 
Beziehungen zwischen Qualitaten und ihren Regionen, sowie Beziehungen 
zwischen Entitäten und ihren Qualitäten. Die entsprechenden Relationen 
wurden bei der Integration des Metamodells bereits verwendet und, wo not- 
wendig, konsistent um weitere Relationen ergänzt. Zwischen Enduranten 
und Perduranten definiert DOLCE weiterhin eine Beziehung der Teilnahme. 
Ein Endurant kann dabei an einem Perduranten, z.B. einem Ereignis, teil- 
nehmen. Für Domänenmodelle der objektorientierten Umweltmodellierung 
kann dieser Typ von Beziehung genutzt werden, um z.B. die an relevan- 
ten Vorgängen beteiligten Objekte anzugeben. Enduranten wie Perduranten 
können weiterhin auch Teile besitzen. Zu diesem Zweck definiert DOLCE 
eine Teile-Ganzes-Beziehung. Allerdings können Teile von Enduranten in 
DOLCE nur weitere Enduranten sein, und Teile von Perduranten nur weite- 
re Perduranten. Neben Teilen können Enduranten wie Perduranten auch Be- 
standteile haben. Auch hierfür wird in DOLCE eine Beziehung definiert. Im 
Gegensatz zur Teile-Ganzes-Beziehungen basiert die Bestandteil-Beziehung 
dabei auf einer ontologischen Schichtung von Entitäten: während ein Tisch 
z.B. Beine als Teile haben kann, so kann eine Menge Holz einer seiner Be- 
standteile sein. Schließlich definiert DOLCE auch Beziehungen zwischen 
nichtphysischen Enduranten und den für ihre Existenz notwendigen phy- 
sischen Enduranten. Diese können in Domänenmodellen der objektorien- 
tierten Umweltmodellierung genutzt werden, um die Beziehungen zwischen 
Rollen und den sie erfüllenden physischen Objekt darzustellen. Darüber hin- 
aus besitzt DOLCE auch noch weitere, spezielle Typen von Beziehungen, auf 
die hier aber nicht weiter eingegangen wird. 
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Darstellung von Zeit Zwei weitere wichtige Aspekte des Kernmodells sind 
die Darstellung von Zeit sowie die Darstellung von Raum bzw. Orten. DOL- 
CE behandelt Ort und Zeit dabei gleich wie jede andere Qualität: es werden 
entsprechende Regionen definiert, innerhalb derer konkrete Werte darge- 
stellt werden können [Mas03]. Wie diese Regionen genau strukturiert sind, 
wird dabei auf der Ebene der Top-Level Ontologie nicht festgelegt. Als Qua- 
litäten werden dabei ein Ortsbezug und ein Zeitbezug modelliert, als Regio- 
nen z.B. ein Zeitintervall. In Bezug auf die Darstellung von zeitlichen Aus- 
sagen bietet DOLCE in seiner vollen prädikatenlogischen Axiomatisierung 
die Möglichkeit von zeitindizierten Relationen. Mittels dieser kann ausge- 
drückt werden, zu welchem Zeitpunkt oder Zeitintervall eine Relation Gel- 
tung besitzt. 


Für die objektorientierte Umweltmodellierung ist zumindest die Darstellung 
von Zeitstempeln wichtig. Dies gilt für die probabilistische Informationsver- 
waltung sowie für eine adaptive Umweltmodellierung. Beispielsweise wer- 
den Zeitstempel zur Angabe der Zeitpunkte benötigt, zu welchen ein Objekt 
in der betrachteten Umgebung sensoriell beobachtet wurde. Auch werden 
Zeitstempel benötigt um darzustellen, zu welchem Zeitpunkt ein Repräsen- 
tant im Weltmodell zuletzt aktualisiert wurde. Falls mittels adaptiver Um- 
weltmodellierung neue Konzepte für das Hintergrundwissen gelernt werden 
können, so muss ebenfalls durch Zeitstempel markiert werden, wann diese 
dem Hintergrundwissen hinzugefügt wurden. Die Angabe einfacher Zeits- 
tempel ist in OWL über zwei sprachinterne Konstrukte möglich, welche eine 
deterministische Darstellung von Zeitstempeln mittels ISO 8601 kompatibler 
Datentypen ermöglichen. Dieser Mechanismus ist für die genannten inter- 
nen Zwecke der objektorientierten Umweltmodellierung zunächst ausrei- 
chend. Weiterhin ermöglicht die Kern-Ontologie der objektorientierten Um- 
weltmodellierung eine Zeitdauer als Qualität zu modellieren, welche mittels 
probabilistischer Attribute und in einer modellierten Zeiteinheit auch unsi- 
cherheitsbehaftet dargestellt werden kann. Domänenmodelle können somit 
eine Zeitdauer, wenn benötigt, repräsentieren. Sollen zusätzlich (determi- 
nistische) Zeitintervalle in einer gemischten Darstellung in verschiedenen 
Zeiteinheiten angegeben werden können, so ist die Integration existierender 
Zeit-Ontologien sinnvoll. Ein guter Kandidat ist hierbei durch OWL-Time 
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[W3C20] gegeben. Im Rahmen dieser Arbeit wurde dieser Aspekt allerdings 
nicht genauer betrachtet. Auch weitere zeitliche Relationen, welche symbo- 
lische Beziehungen zwischen Zeitintervallen und Zeitpunkten formal dar- 
stellen, werden in der Kern-Ontologie nicht betrachtet, da eine Darstellung 
mittels Zeitstempeln fiir die probabilistische Informationsverwaltung und 
adaptive Umweltmodellierung ausreichend ist. Symbolische zeitliche Rela- 
tionen, welche auch zeitliches Schlussfolgern ermöglichen, können jedoch in 
entsprechenden Domänenmodellen oder in den der objektorientierten Um- 
weltmodellierung nachgelagerten Komponenten definiert und aufgrund der 
Zeitstempel des Kernmodells instanziiert werden, falls gewünscht. 


Darstellung von Orten Die Darstellung von Orten ist für die objektorien- 
tierte Umweltmodellierung aus zwei Gründen wichtig: einerseits für Positio- 
nen von konkreten Entitäten, andererseits für die Repräsentation von quali- 
tativem ortsbezogenen Vorwissen für Typen von Entitäten. Positionen müs- 
sen z.B. für beobachtete Objekte (Instanzen) angegeben werden. Die Angabe 
erfolgt metrisch und kann sich, abhängig von Anwendungsfall und -domäne, 
auf ein lokales bzw. globales geometrisches oder auf ein geographisches Ko- 
ordinatensystem beziehen. Durch die Festlegung entsprechender Koordina- 
tenreferenzsysteme in einem Domänenmodell können auch unterschiedli- 
che Koordinatensystem zugleich unterstützt werden [Kuw13c], die Positi- 
onsangaben müssen dann entsprechend transformiert werden. Die einzel- 
nen Arten von Koordinaten in einer Positionsangabe können als Qualitäten 
in Domänenmodellen unter der Qualität Ortsbezug in der Kern-Ontologie 
eingehängt werden und stellen im Regelfall perzeptive, zustandsbezogene 
Qualitäten dar. 


Zur Repräsentation von qualitativen Ortsangaben werden räumliche Rela- 
tionen benötigt. In DOLCE wurden bereits einige relevante Beziehungen 
definiert, darunter eine Teile-Ganzes-Beziehung, eine Verbundenheitsbezie- 
hung und eine Überlappungsbeziehung. Zusätzlich kann die Definition wei- 
terer räumlicher Beziehungen sinnvoll bzw. notwendig sein. Dies kann z.B. 
die Definition spezifischer Abstands- und Richtungsbeziehungen betreffen. 
Ebenfalls kann eine Enthaltenseins-Beziehung betroffen sein, welche mo- 
delliert, dass sich ein Objekt innerhalb eines anderen Objekts befindet, ohne 
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ein Teil von diesem zu sein. Unter Verwendung dieser Beziehungen können 
ebenfalls Ortsangaben für konkrete Entitäten beschrieben werden. 


Um semantisches ortsbezogenes Vorwissen für Konzepte in einem Hinter- 
grundwissensmodell darzustellen, werden ebenfalls qualitative räumliche 
Relationen benötigt. Semantisches ortsbezogenes Vorwissen beschreibt da- 
beii. A. räumliche Beziehungen, die zwischen Typen von Entitäten bestehen, 
nicht zwischen Instanzen. So kann z.B. beschrieben werden, in welcher 
räumlichen Anordnung hypothetische Instanzen bestimmter Typen von 
Entitäten zueinander gegeben sein müssten, damit eine bestimmte Situation 
vorliegt (wie z.B. ein gedeckter Esstisch, als Beispiel aus der Haushaltsdo- 
mäne). Auch soll häufig Vorwissen darüber beschrieben werden, in welchen 
räumlichen Beziehungen bestimmte Typen von Entitäten grundsätzlich 
stehen können. Zu diesem Zweck werden räumliche Relationen benötigt, 
welche eine modale oder zweckgebundene Semantik besitzen. Beispiels- 
weise kann so Vorwissen darüber dargestellt werden, wo hypothetische 
Instanzen eines bestimmten Typs von Entität wahrscheinlich aufzufinden 
sind, sollten sie gesucht werden (z. B. wenn Teller zum Decken eines Tisches 
benötigt werden, um im Beispiel der Haushaltsdomäne zu bleiben), oder wo 
solche Instanzen z.B. zum Zwecke einer Lagerung aufbewahrt werden. 


DOLCE bietet einen passenden Aufsatzpunkt, falls es nötig oder gewünscht 
sein sollte, bestimmte qualitative räumliche Beziehungen auf der Grundlage 
von metrischen Positionsangaben zu definieren und somit in einer perzepti- 
ven Qualität zu verankern. Durch ein solches Vorgehen lässt sich die Bedeu- 
tung einer räumlichen Relation über deren semantischen, qualitativen As- 
pekt hinaus durch quantitative Anteile ergänzen. Der Aufsatzpunkt ist durch 
die Kategorie der parasitären Entitäten in der Taxonomie von DOLCE (und 
somit auch in der Kern-Ontologie) gegeben. Somit können z.B. das Innere 
eines hohlen Gegenstandes oder die Oberseite eines Gegenstandes als pa- 
rasitäre Entitäten modelliert werden. Durch eine solche Modellierung lässt 
sich dann z.B. eine räumliche Enthaltenseins-Beziehung zwischen hohlen 
Gegenständen und weitere Gegenständen über deren Positionen, innere und 
äußere Abmessungen sowie Formen quantitativ beschreiben. Ähnliches ist 
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für Richtungsbeziehungen wie „auf“ möglich. Derart in perzeptiven Quali- 
täten verankerte Relationen können für ein technisch kognitives System zur 
Ausführung seiner Aufgaben oft nützlicher sein als rein qualitative Relatio- 
nen. Ob eine solche Verankerung notwendig ist, hängt allerdings wiederum 
vom betrachteten Anwendungsfall ab. In Abschnitt 5.3.4 wird ein Beispiel 
dafür gegeben, wie eine probabilistische räumliche Relation vom Typ „nahe 
bei“ auf Basis der Positionsattribute der beteiligten Repräsentanten definiert 
werden kann. 


Interoperable Bereitstellung von Beobachtungen Die Kern-Ontologie 
unterstützt nicht nur die Erstellung von interoperablen Domänenmodellen, 
sondern kann darüber hinaus für eine interoperable Anbindung von unter- 
schiedlichen Sensoren an ein objektorientiertes Umweltmodell genutzt wer- 
den. Dies wird ermöglicht durch die formale Repräsentation der Prinzipien 
des Metamodells. Darüber hinaus wird allerdings auch konkretes Wissen 
über die zu modellierende Domäne und ggf. Anwendung benötigt, und zwar 
in Form der auftretenden Qualitäten. 


Steht die Taxonomie mit konkret verwendeten Qualitäten auf Ebene eines 
Anwendungsmodells fest, so kann diese Taxonomie als Wissensartefakt für 
eine interoperable Erstellung von Beobachtungen genutzt werden [Kuw16]. 
Dies wird in Abbildung 4.10 illustriert. Beobachtungen bezeichnen hierbei 
die Datenstrukturen, mittels derer die Messergebnisse für Qualitäten von 
Domänen-Entitäten durch Sensoren an die Weltmodell-Komponente des ob- 
jektorientierten Umweltmodells übermittelt werden. 


Softwaretechnisch kann das objektorientierte Umweltmodell hierbei als ein 
Server betrachtet werden, welcher die Qualitäts-Taxonomie als eine eige- 
ne Ontologie bereitstellt und somit für angebundene Sensoren verfügbar 
macht. Einem Sensor wird somit die Menge der definierten Qualitäten für 
Domänen-Entitäten bekannt gemacht, sowie die Information, auf welche Art 
gemessene Werte für eine Qualität im Umweltmodell repräsentiert werden, 
also z.B. in Bezug auf das Skalenniveau und den Wertebereich einer Quali- 
tät. Auf dieser Grundlage kann, unter Angabe der gewünschten Qualitäten, 
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Abbildung 4.10: Interoperabilität und externe Schnittstellen im objektorientierten Umwelt- 
modell OOWM (angepasst aus [Kuw16]). Eine Qualitäts-Taxonomie definiert 
die beobachtbaren Eigenschaften von Entitäten, welche im Weltmodell reprä- 
sentiert werden können. Die Sensordaten, die sich als Ergebnis einer Messung 
solcher Eigenschaften ergeben, werden zunächst zu Beobachtungen konver- 
tiert und anschließend ans Weltmodell gesendet. 


automatisiert eine Beobachtungsdatenstruktur erzeugt werden, welche ent- 
sprechende Attribut-Schablonen enthält. Attribut-Schablonen sind in An- 
lehnung an die Attribute des Metamodells definiert. In sie können die Mess- 
ergebnisse für die einzelnen Qualitäten eingetragen werden, samt einer Un- 
sicherheit der Messung. Zusätzlich müssen in der Beobachtung noch Meta- 
informationen zur Messung (wie Zeitstempel, Position, ggf. eine Referenz 
auf eine bereits bekannte Entität etc.) bereitgestellt werden. Die befüllte Be- 
obachtung kann anschließend an das Weltmodell übertragen werden. Durch 
dieses Vorgehen wird insgesamt eine Entkopplung der konkret eingesetzten 
Sensorik von den erworbenen Informationen erreicht, welche zugleich die 
semantische Interoperabilität der Informationen sicherstellt. Dieser Ansatz 
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stellt unter den Voraussetzungen des objektorientierten Umweltmodells ei- 
ne Alternative zur direkten Verankerung der symbolischen Repräsentanten 
des Weltmodells in Sensordaten dar. 


Automatisierte Erstellung der Repräsentationsstrukturen Die voraus- 
gehend beschriebene, zum Großteil automatisierte Erstellung einer Beob- 
achtungsdatenstruktur zeigt den Aspekt, dass die zur Repräsentation von 
probabilistischen Informationen im Kern-Modell benötigten semantischen 
Netze prinzipiell automatisiert aus einfacheren Darstellungsformen erzeugt 
werden können. Diese einfacheren Darstellungsformen müssen dabei al- 
le benötigten Informationen enthalten. Diese prinzipielle Möglichkeit einer 
automatisierten Verarbeitung vereinfacht auch die Weiterverarbeitung von 
in der Kern-Ontologie repräsentierten Informationen. Eine Weitergabe von 
Informationen kann dabei z.B. intern im objektorientierten Umweltmodell 
erfolgen, durch Konvertierungen zwischen verschiedenen Darstellungsfor- 
men, oder extern, wenn die Informationen von weiteren Komponenten eines 
kognitiven Systems abgerufen werden. 


4.5 Erstellung von Domänenmodellen zur 
Kern-Ontologie 


Die in dieser Arbeit definierte Kern-Ontologie für die objektorientierte Um- 
weltmodellierung vereinigt die im Metamodell beschriebenen Aspekte mit 
einer grundlegenden Strukturierung von Wissen durch eine Top-Level On- 
tologie. Die Kern-Ontologie dient dabei primär als Ausgangspunkt zur Er- 
stellung von domänenspezifischen Modellen. Für ein Hintergrundwissens- 
modell in der objektorientierten Umweltmodellierung lassen sich somit fol- 
gende Ebenen unterscheiden: 


« Top-Level Ontologie (DOLCE Lite), 
« Kern-Ontologie (Umsetzung und Integration des Metamodells), 
« Domänenmodell und 


e Anwendungsmodell. 
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Die Ebenen entsprechen den in der Literatur genannten Schichten zum Auf- 
bau eines geschichteten Ontologie-Modells (vgl. 2.2.3). Alle Schichten wer- 
den beim gewählten Vorgehen in OWL 2 DL beschrieben. 


Domänen- und Anwendungsmodelle werden als Erweiterungen der Kern- 
Ontologie erstellt. Dabei müssen die domänenspezifischen Entitäten und 
Relationen sowie deren Qualitäten modelliert werden. Die Erstellung solcher 
Modelle kann schrittweise erfolgen. Bei der Vorstellung des Metamodells 
in Abschnitt 4.3.1 wurde bereits darauf eingegangen, dass die Eigenschaf- 
ten der in einer Anwendung relevanten Qualitäten schrittweise festgelegt 
werden können. Zu diesem Zweck dient z.B. die Angabe des maximalen 
Skalenniveaus einer Qualität. Eine schrittweise Spezifizierung bedeutet, 
dass auf Ebene eines Domänenmodells Qualitäten zunächst nur abstrakt 
beschrieben werden, um die derart dargestellten Qualitäten auch für unter- 
schiedliche Anwendungsfälle nutzen zu können. Qualitäten können somit 
in verschiedenen Anwendungsmodellen unterschiedlich spezialisiert wer- 
den. Dies gilt in gleicher Weise natürlich auch für abstrakter beschriebene 
Domänen-Entitäten. Allerdings können in einer Domäne auch Entitäten 
relevant sein, die bereits auf der Ebene des Domänenmodells konkreter 
modelliert werden müssen. In diesem Fall kann bereits hier für einzelne 
Qualitäten eine konkrete Beschreibung erforderlich sein. Auch kann es sein, 
dass auf der Ebene des Domänenmodells bereits probabilistische Relatio- 
nen benötigt werden, um die Beziehung zwischen Typen von Domänen- 
Entitäten konkret beschreiben zu können. Diese domänenspezifischen 
Relationen müssen schließlich auf der Ebene des Anwendungsmodells um 
anwendungsspezifische Relationen ergänzt werden. Hier müssen auch alle 
anwendungsrelevanten Domänen-Entitäten und deren Qualitäten konkret 
beschrieben werden. Das Anwendungsmodell legt somit die Terminologie 
fest, welche dann in der Weltmodell-Komponente des objektorientierten 
Umweltmodells zur Darstellung des Umgebungszustandes verwendet wird. 


Eine weitere Art des schrittweisen Vorgehens, welche als orthogonal zu den 
Ebenen der Ontologie-Schichtung betrachtet werden kann, betrifft die deter- 
ministische gegenüber der probabilistischen Modellierung der Eigenschaf- 
ten und Beziehungen von Domänen-Entitäten. Dabei kann z.B. zunächst ein 
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relationales Modell mit deterministischen Attributen und Relationen erstellt 
werden. Anschließend kann, wo gewünscht oder notwendig, dieses relatio- 
nale Modell um eine Darstellung von Unsicherheiten erweitert werden, in 
Form von probabilistischen Attributen und Relationen. Eine derartige Be- 
schreibung erhöht oft die Präzision des modellierten Wissens (eine Tatsa- 
che, die sich als Erfahrungswissen auch in der Redewendung „keine Regel 
ohne Ausnahme“ widerspiegelt). Auf diese beiden Schritte zur Erstellung ei- 
nes Hintergrundwissensmodells für die objektorientierte Umweltmodellie- 
rung wird nachfolgend eingegangen. Zuvor sei noch allgemein angemerkt, 
dass insgesamt zur Erstellung von Hintergrundwissensmodellen ein struk- 
turiertes Vorgehen angewendet werden sollte, wie in Abschnitt 2.2.3 darge- 
stellt. Die Erstellung der probabilistischen Modellanteile kann dabei z.B. in 
der Definitionsphase nach der Konzeptualisierung und vor der eigentlichen 
Formalisierung erfolgen. 


4.5.1 Relationale Modellierung 


Ähnlich wie die in Abschnitt 2.2.4 vorgestellten logisch-probabilistischen 
Modellierungssprachen besteht auch ein Hintergrundwissensmodell der ob- 
jektorientierten Umweltmodellierung aus einem relationalen Anteil und ei- 
nem probabilistischen Anteil. Der relationale Anteil ergibt sich dabei größ- 
tenteils aus dem Einsatz von OWL als Repräsentationssprache sowie aus den 
bereits in DOLCE definierten Modellelementen. Relational und somit deter- 
ministisch werden z.B. taxonomische Zusammenhänge zwischen Konzep- 
ten sowie zwischen Relationen modelliert. In DOLCE werden, wie genannt, 
grundlegende Arten von deterministischen Beziehungen festgelegt, darun- 
ter z.B. Teile-Ganzes-Beziehungen und Bestandteil-Beziehungen. Diese Be- 
ziehungen sind ebenfalls deterministisch modelliert. Sie können auch in der 
objektorientierten Umweltmodellierung als Basisbeziehungen genutzt wer- 
den. Falls benötigt, können probabilistische Versionen dieser Beziehungen 
in einer Domänen-Ontologie als typisierte Relationen definiert werden. Wei- 
terhin können auch in Domänen- und Anwendungsmodellen deterministi- 
sche Attribute und Beziehungen eingeführt werden, falls die Gegebenheiten 
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der betrachteten Domäne dies erlauben oder erfordern. Deterministische At- 
tribute können dabei als eine abkürzende Schreibweise für probabilistische 
Attribute mit sicherer Wahrscheinlichkeit aufgefasst werden. Unter Anwen- 
dung einer Modelltransformation können solche deterministischen Attribu- 
te auch in bedeutungsgleiche probabilistische Attribute überführt werden. 
Ähnliches gilt für deterministische Beziehungen. Ein Vorteil, der sich durch 
den relationalen Anteil eines Domänenmodells ergibt, ist die Anwendung 
von Standard-Verfahren für OWL Reasoning, z.B. zur Konsistenzprüfung 
des Wissensmodells während der Entwicklung oder für semantische Abfra- 
gen von Wissen durch andere Komponenten des kognitiven Systems. 


Somit kann es vorteilhaft sein, für ein zu erstellendes Domänenmodell zu- 
nächst eine relationale Grundstruktur zu modellieren und zu verifizieren. 
Auch die Zugreifbarkeit von in dieser Grundstruktur modellierten Informa- 
tionen durch standardisierte Abfragesprachen wie SPARQL' kann von Vor- 
teil sein. Daher sollten auch die probabilistischen Domänenmodelle in der 
objektorientierten Umweltmodellierung auf einem soliden relationalen Ba- 
sismodell aufsetzen. 


4.5.2 Probabilistische Modellierung einer Domäne 


Ein wesentliches Merkmal der objektorientierten Umweltmodellierung ist 
die konsistente Behandlung von unsicherheitsbehafteten Informationen. 
Motiviert wird dieses Vorgehen vor allem aus der messtechnischen Sicht 
heraus, dass die Beobachtungen von Objekten als Messungen auch immer 
mit einer Messunsicherheit verbunden sind. Beobachtungen werden in der 
Weltmodell-Komponente des objektorientierten Umweltmodells verarbei- 
tet. Daher wird in Vorarbeiten auch hauptsächlich dort eine probabilistische 
Informationsverarbeitung und -darstellung betrachtet. 


Auch ein Hintergrundwissensmodell muss allerdings grundsätzlich in der 
Lage sein, mit den unsicherheitsbehaftet dargestellten Repräsentanten des 


* Abfragesprache des W3C für RDF und OWL, Spezifikation gegeben unter: https://www.w3. 
org/TR/rdf-sparql-query/ 
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Weltmodells umgehen zu können. Dies betrifft z.B. deren Zuordnung zu ei- 
nem passenden Konzept. Konzepte können dabei ebenfalls in probabilisti- 
scher Form beschrieben werden. Darüber hinaus kann eine allgemeine Dar- 
stellung von unsicherheitsbehaftetem Vorwissen auch vorteilhaft sein und 
vermag sogar in einigen Fällen einen Sachverhalt per se präziser auszudrü- 
cken als eine deterministische Repräsentation. Andererseits ist die probabi- 
listische Modellierung einer Domäne i. A. aufwendiger als eine rein relatio- 
nale Modellierung, z.B. in Bezug auf die Anzahl an festzulegenden Parame- 
tern (für Wahrscheinlichkeitsverteilungen). 


Die probabilistische Modellierung einer Domäne in der objektorientierten 
Umweltmodellierung stellt somit immer einen Kompromiss dar. Auf der ei- 
nen Seite steht dabei die notwendige Unterstützung des Weltmodells und die 
erhöhte Präzision bei der probabilistischen Repräsentation von Vorwissen, 
auf der anderen Seite steht dagegen der erhöhte manuelle Aufwand der Mo- 
dellerstellung. Daher soll nachfolgend zunächst die Frage betrachtet werden, 
für welche Anteile eines Hintergrundwissensmodells eine probabilistische 
Modellierung nutzbringend oder sogar erforderlich ist. Die Betrachtung und 
Festlegung erfolgt dabei auf der Ebene von Konzepten, Qualitäten und Rela- 
tionen. Eine detaillierte Antwort auf diese Frage hängt i. A. vom betrachteten 
Anwendungsfall ab. Darüber hinaus lassen sich allerdings für die objektori- 
entierte Umweltmodellierung auch allgemeine, d.h. domänenunabhängige 
Aussagen bzgl. dieser Fragestellung ableiten. 


Sobald feststeht, welche Anteile probabilistisch zu modellieren sind, stellt 
sich die Frage nach dem „Wie“ einer probabilistischen Modellierung, d.h. 
einem Vorgehen zur Erstellung von entsprechenden probabilistischen Be- 
schreibungen. Diese Fragestellung wird ebenfalls nachfolgend erörtert. 


147 


4 Strukturierung und Repräsentation von Vorwissen 


Anwendungszweck der probabilistischen Modellierung für die 
Umweltmodellierung 


Wie in den Anforderungen an die Wissensmodellierung in der objektorien- 
tierten Umweltmodellierung beschrieben, dient die probabilistische Model- 
lierung von Konzepten zwei hauptsächlichen Anwendungszwecken: Einer- 
seits soll sie die Klassifikation von probabilistisch beschriebenen Repräsen- 
tanten ermöglichen, andererseits das Ableiten von weiteren Informationen 
über klassifizierte Repräsentanten. Diese Informationen können in Form von 
semantischen Attributen oder allgemein als Relationen im Wissensmodell 
gegeben sein. Für die probabilistische Modellierung einer Domäne bedeutet 
dies, dass zumindest all diejenigen Konzepte, die im Anwendungsfall durch 
konkrete Objekte der Domäne instanziierbar sind, mittels probabilistischer 
Attribute beschrieben werden sollten. Dies betrifft unmittelbar zunächst ein- 
mal nur die Blattkonzepte der „is-a-“-Generalisierungshierarchie eines Hin- 
tergrundwissensmodells. In Bezug auf die Klassifikation von Repräsentan- 
ten sind für diese Blattkonzepte weiterhin nur die Attribute für perzeptive, 
nicht zustandsbezogene Qualitäten relevant. 


Adaptive Umweltmodellierung In einer offenen Welt muss weiterhin die 
Situation berücksichtigt werden, dass für einen zu klassifizierenden Reprä- 
sentanten kein direktes Konzept im Wissensmodell hinterlegt ist, dass al- 
so keines der Blattkonzepte den Repräsentanten hinreichend gut beschreibt 
(für eine genauere Betrachtung der Fragestellung, wann eine Beschreibung 
hinreichend gut ist, sei an dieser Stelle auf Kapitel 6 verwiesen). In diesem 
Fall kann es von Mehrwert sein, einen Repräsentanten dennoch grob taxo- 
nomisch einordnen zu können. Zu diesem Zweck können übergeordnete 
Konzepte auf den nächsten Ebenen über den Blattkonzepten in der Gene- 
ralisierungshierarchie verwendet werden, solange diese Konzepte nicht zu 
abstrakt definiert sind. Die übergeordneten Konzepte sollten dazu zumin- 
dest noch ausreichend diskriminative perzeptive Attribute aufweisen (um 
einen Repräsentanten eindeutig zuweisen zu können) sowie informative se- 
mantische Attribute (um nach einer Klassifizierung entsprechend nützliche 
Informationen ableiten zu können). Wenn, als ein Beispiel aus der später be- 
trachteten Haushaltsdomäne, ein Repräsentant weder als Tafelmesser noch 
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als Anrichtemesser klassifiziert werden kann, so kann es dennoch nützlich 
sein, den durch den Repräsentanten dargestellten Gegenstand allgemein als 
ein Messer identifizieren zu können. Seine Einordnung als ein Werkzeug 
oder gar als ein Gegenstand, angenommen dies wären die dem Konzept Mes- 
ser taxonomisch übergeordneten Konzepte, wäre dagegen deutlich weniger 
informativ. Somit kann es zur Unterstützung der adaptiven Umweltmodel- 
lierung angebracht sein, nicht nur die Blattkonzepte, sondern auch die Kon- 
zepte der direkt darüber liegenden Ebenen probabilistisch zu modellieren. 


Allerdings besteht bei diesem Vorgehen oft die Schwierigkeit, belastbare und 
zugleich präzise Informationen zur Erstellung der probabilistischen Modelle 
für die Qualitäten solcher abstrakter Konzepte zu erwerben. Besonders in 
dem Fall, dass nicht alle möglichen untergeordneten Konzepte tatsächlich 
ausmodelliert werden sollen, kann dieses Vorgehen dennoch nützlich bzw. 
notwendig sein. Alternativ zu einer manuellen probabilistischen Modellie- 
rung der Konzepte ist auch ein automatisiertes Vorgehen möglich. In diesem 
Fall werden die probabilistischen Attribute eines übergeordneten Konzepts 
aus den probabilistischen Attributen aller untergeordneten Konzepte rekur- 
siv durch Zusammenfassung und Generalisierung automatisiert abgeleitet. 
Verfahren, die dafür eingesetzt werden könnten, werden z.B. in Kapitel 8.4 
beschrieben. 


Bisher wurde die Frage nach einer probabilistischen Modellierung nur für 
perzeptive Attribute betrachtet. Die Betrachtung konnte dabei domänenun- 
abhängig durchgeführt werden. Ob für semantische und deduktive Attribute 
eine probabilistische Modellierung ebenfalls notwendig ist oder ob ein deter- 
ministisches Modell ausreicht, kann von Anwendungsfall zu Anwendungs- 
fall entschieden werden. Weiterhin kann es ein Anwendungsfall auch erfor- 
dern, zusätzlich zu den bisher genannten Konzepten noch weitere Konzepte 
mittels probabilistischer Attribute darzustellen, z.B. wenn eine determinis- 
tische Beschreibung zu unpräzise wäre. 
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Vorgehen für die probabilistische Modellierung 


Als probabilistische Modelle sind im Hintergrundwissen des objektorientier- 
ten Umweltmodells die Wahrscheinlichkeitsverteilungen für die probabilis- 
tischen Attribute relevanter Typen von Entitäten und Relationen zu model- 
lieren. Die modellierten Wahrscheinlichkeiten werden in der objektorien- 
tierten Umweltmodellierung dabei als Bayes’sche Wahrscheinlichkeiten im 
Sinne eines Grades des Dafürhaltens interpretiert. Als A-priori-Verteilungen 
stellen sie somit unsicherheitsbehaftetes Vorwissen für die Qualitäten der 
betrachteten Entitäten und Relationen bereit. 


Definition von A-priori-Verteilungen Die Frage, unter welchem Vorge- 
hen Vorwissen in Form von A-priori-Verteilungen modelliert werden sollte, 
kann als eine eigene Forschungsfrage innerhalb der Bayes’schen Statistik 
betrachtet werden. Grundsätzlich lassen sich zwei verschiedene Arten von 
Vorgehen unterscheiden, welche als subjektiv bzw. objektiv bezeichnet wer- 
den [Jay68]. Bei einem subjektiven Vorgehen ergibt sich die modellierte A- 
priori-Verteilung anhand der persönlichen Vorstellung eines Experten, ba- 
sierend auf seinem entsprechenden Vorwissen. Für verschiedene Experten 
können sich dabei auch bei gleichem Vorwissen unterschiedliche A-priori- 
Verteilungen ergeben. Dieser Aspekt wird aus Sicht eines objektiven Vorge- 
hens kritisiert. Objektive Vorgehen stellen dabei Prinzipien in den Vorder- 
grund, mittels derer sich A-priori-Verteilungen ausgehend von einem gege- 
benen Vorwissen methodisch und somit objektiv ableiten lassen. Dies betrifft 
z.B. das Indifferenzprinzip nach Laplace oder das Prinzip der maximalen En- 
tropie nach Jaynes [Jay68]. Bei letzterem wird aus einer gegebenen Klasse 
von zulässigen Wahrscheinlichkeitsverteilungen diejenige Verteilung aus- 
gewählt, welche die größte Entropie besitzt (im Sinne der Shannon’schen 
Informationstheorie). Je größer die Entropie, desto weniger Information ist 
in einer Verteilung enthalten. Das Prinzip der maximalen Entropie zielt nun 
daraufhin ab, außer den notwendigen Bedingungen so wenig wie möglich 
zusätzliche Informationen in einer Verteilung darzustellen, da solche zusätz- 
liche Informationen nicht objektiv begründbar sind. Die notwendigen Bedin- 
gungen beschreiben dabei die Klasse der zulässigen Verteilungen, aus denen 
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die optimale Verteilung ausgewählt wird, und können z. B. als Bedingungen 
an die Momente von Verteilungen formuliert sein. 


A-priori-Verteilungen in der Umweltmodellierung In der objektorien- 
tierten Umweltmodellierung soll in einem Hintergrundwissensmodell Vor- 
wissen über eine Anwendungsdomäne repräsentiert werden. Solches Vor- 
wissen kann dabei von Domänenexperten bereitgestellt werden. Für die A- 
priori-Verteilungen der Attribute probabilistisch modellierter Typen von En- 
titäten bedeutet dies, dass sie dabei unter Anwendung eines subjektiven Vor- 
gehens erzeugt werden. Sind für die Werte von Attributen Einschränkungen 
bekannt, mittels derer sich entsprechende Bedingungen an die möglichen 
Wahrscheinlichkeitsverteilungen der Attribute beschreiben lassen, so kann 
auch ein objektives Vorgehen zur Erstellung der A-priori-Verteilungen ein- 
gesetzt werden, z.B. die Methode der maximalen Entropie. Häufig sind die 
für eine Anwendungsdomäne der objektorientierten Umweltmodellierung 
zu modellierenden Informationen allerdings nicht derart formalisierbar, dass 
entsprechende Bedingungen abgeleitet werden könnten, welche z.B. Mo- 
mente der Verteilung charakterisieren. Zumindest geht dies häufig nicht in 
einer Form, die zur objektiven Erzeugung von ausreichend informativen A- 
priori-Verteilung benötigt werden würde. Einschränkungen von Wertebe- 
reichen auf z.B. Nichtnegativität sind dagegen möglich. Einen Kompromiss 
zwischen subjektiver und objektiver Modellierung stellt eine Modellierung 
der A-priori-Verteilungen auf Basis einer statistischen Analyse entsprechen- 
der Attributwerte dar. Dieser Ansatz ist auch für die Anwendungsdomänen 
der objektorientierten Umweltmodellierung relevant. 


Pragmatische Aspekte Neben den wissenschaftstheoretischen Aspekten 
bezüglich der Erzeugung einer A-priori-Verteilung spielen für das objekt- 
orientierte Umweltmodell als eine Softwarekomponente auch noch weitere 
Aspekte eine Rolle. Diese Aspekte beinhalten die Art der Repräsentation 
einer A-priori-Verteilung sowie ihre effiziente Weiterverarbeitbarkeit z.B. 
im Rahmen der probabilistischen Informationsverarbeitung. Entsprechende 
Anforderungen aus Sicht des objektorientierten Umweltmodells, um eine 
effiziente Verarbeitung sicherzustellen, bestehen hierbei in einer para- 
metrischen Repräsentation der Verteilung, d.h. für stetige Merkmal z.B. 
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in Form von Normalverteilungen oder Gaußmischverteilungen. Zu An- 
fang dieses Kapitels wurden stochastische Unabhängigkeitsannahmen für 
Hintergrundwissensmodelle der objektorientierten Umweltmodellierung 
formuliert. Aufgrund dieser Annahmen kann jedes Attribut einer Entität 
i. A. für sich, also unabhängig von den anderen Attributen, stochastisch 
modelliert werden. 


Stichproben-basierte Definition von Verteilungen Einen pragmatischen 
Ansatz zur Modellierung der A-priori-Verteilungen betroffener Typen von 
Entitäten und Relationen stellt daher der oben genannte Kompromiss dar, 
nämlich die Definition der Verteilungen auf Basis einer statistischen Ana- 
lyse. Zu diesem Zweck kann für eine zu modellierende Qualität zunächst 
eine Stichprobe der relevanten Werte für den entsprechenden Typ von Enti- 
tät ermittelt werden. Die Werte können dabei aus existierenden Wissens- 
modellen, Datenbanken oder anderen verfügbaren Quellen bezogen wer- 
den. Handelt es sich um eine perzeptive Qualität, lassen sich entsprechen- 
de Werte auch algorithmisch ermitteln, z.B. unter Verwendung von Metho- 
den der Bildverarbeitung. In diesem Fall muss allerdings zunächst entspre- 
chendes Bildmaterial für die zu modellierenden Objekte bezogen werden. 
Aus diesem Bildmaterial können ggf. Werte für unterschiedliche perzepti- 
ve Qualitäten ermittelt werden (z.B. Farbe und Form). Liegt eine Stichpro- 
be mit entsprechenden Werten für eine Qualität vor, kann z.B. mittels ei- 
ner Kerndichteschätzung eine Wahrscheinlichkeitsverteilung erzeugt wer- 
den. Die objektorientierte Umweltmodellierung geht grundsätzlich von un- 
sicherheitsbehafteten Messungen aus. Dies trifft z. B. auch für algorithmisch 
ermittelte Stichprobenwerte zu. Die Messunsicherheit des Algorithmus kann 
daher in der Kerndichteschätzung zur Bestimmung der Bandbreite der ein- 
gesetzten Kerne verwendet werden. Als Typ von Kern bieten sich für die 
objektorientierte Umweltmodellierung Gaußkerne an. Die erzeugte Wahr- 
scheinlichkeitsverteilung kann anschließend noch generalisiert werden, z. B. 
über Ansätze zur Komponentenreduktion für Gaußmischverteilungen, ähn- 
lich zum in Abschnitt 8.4.3 beschriebenen Vorgehen beim Konzeptlernen. 
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4.6 Wissensmodell für die 
Haushaltsumgebung 


Zur Demonstration der Einsetzbarkeit und des Nutzens von Metamodell und 
Kern-Ontologie wurde beispielhaft ein Hintergrundwissensmodell erstellt. 
Dieses Modell betrachtet eine menschliche Haushaltsumgebung als Domäne 
und verschiedene küchenbezogene Aufgaben als Anwendung. Das Modell ist 
als eine Ontologie in OWL 2 DL umgesetzt und erweitert die Kern-Ontologie 
der objektorientierten Umweltmodellierung. Nachfolgend wird das entwor- 
fene Modell sowie das Vorgehen zu dessen Entwicklung im Überblick be- 
schrieben. 


4.6.1 Modellentwurf 


Einem strukturierten Vorgehen zum Ontologie-Entwurf folgend (vgl. Ab- 
schnitt 2.2.3), wurde zunächst in einer Analysephase der Einsatzzweck der 
Ontologie definiert und es wurden entsprechende Kompetenzfragen formu- 
liert. Dabei wird ein schichtenweiser Aufbau der Ontologie umgesetzt. An- 
schließend an die Analyse fand die Kategorisierung und Konzeptualisierung 
der relevanten Begriffe statt sowie ihre Einordnung in eine Taxonomie. Zu- 
letzt werden die festgelegten Konzepte formal definiert. Auf diese Entwurfs- 
aspekte wird nachfolgend eingegangen, die Umsetzung des Hintergrundwis- 
sensmodells wird anschließend in Abschnitt 4.6.2 vorgestellt. 


Einsatzzweck Der Anwendungszweck des Modells ist die Modellierung 
von Wissen über Anteile der Domäne des menschlichen Haushalts. Weiter- 
hin dient das Modell allgemein zur Festlegung der Terminologie, in welcher 
Aussagen über die Domäne getroffen werden können. Als konkreter An- 
wendungsfall soll ein Serviceroboter als technisch kognitives System bei der 
Erfüllung von küchenbezogenen Aufgaben unterstützt werden. 
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Aufbau Um Wiederverwendbarkeit für die allgemeineren Anteile des mo- 
dellierten Wissens zu ermöglichen, wurde das Modell aufgeteilt in eine über- 
geordnete Domänen-Ontologie, welche allgemeineres Wissen für die Haus- 
haltsdomäne modelliert, und eine Anwendungs-Ontologie, in welcher auf- 
gabenspezifischeres Wissen modelliert wird. 


Kompetenzfragen Die Konzeption eines Wissensmodells beinhaltet die 
Identifizierung und Kategorisierung relevanter Begriffe für die Domäne und 
Anwendung. Diese Entwurfsaufgabe kann durch Kompetenzfragen unter- 
stützt werden. Kompetenzfragen dienen dabei als Orientierung für die Aus- 
wahl und Modellierung der zu repräsentierenden Domänen-Entitäten und 
Beziehungen. Für das entwickelte Hintergrundwissensmodell ergeben sich 
folgende Kompetenzfragen: 


e Welche Vorgänge sind relevant im menschlichen Alltag, speziell in Be- 
zug auf küchenbezogene Aufgaben? 
« Und je Vorgang im Detail: 

— Wer führt einen Vorgang aus: nur ein Mensch oder auch ein Ser- 
viceroboter? Und gibt es auch Geräte oder Gegenstände, die die 
Durchführung des Vorgangs durch eine entsprechende Funktion 
ermöglichen oder unterstützen? 

— Wer oder was ist das Objekt eines solchen Vorgangs? Beispiels- 
weise verzehrt ein Mensch Lebensmittel, kocht ein Wasserko- 
cher Wasser oder unterhält ein Radio einen Menschen. 

« Welchem Zweck oder in welcher Rolle dient ein bestimmter Gegen- 
stand im menschlichen Alltag, welche Funktion hat ein Gerät? 

+ Welche weiteren Eigenschaften in Bezug auf Küchen- oder Haushalts- 
aufgaben besitzt ein bestimmter Gegenstand? Darunter beispielhaft: 

— Wie permanent ist die Position eines Gegenstandes (z.B. inner- 
halb eines Zimmers)? 

— In welchen Gefäßen werden bestimmte Stoffe (im Sinne von Sub- 
stanzen) aufbewahrt? 


— Aus welchen Stoffen wird ein Produkt hergestellt, und welche 
Inhaltsstoffe besitzt es? 
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— Muss ein Gegenstand gekühlt werden (z.B. Gegenstände, die als 
Lebensmittel dienen)? 


— Welche Stoffe sind bei Zimmertemperatur fest, welche sind flüs- 
sig, welche sind allgemein pulvrig? 


Weiterhin sollen neben den zuvor genannten semantischen Aspekten auch 
perzeptive Eigenschaften modelliert werden: 


e Was sind die definierenden wahrnehmbaren (perzeptiven) Eigenschaf- 
ten eines gegenstandlichen Konzepts? 


— Diese Information wird zur Klassifikation von Repräsentanten 
im Weltmodell mittels probabilistischer Assoziation benötigt. Sie 
betrifft sowohl die Frage, welche Eigenschaften (d.h. Qualitäten 
in DOLCE) für die Klassifikation relevant sind, als auch deren 
konkrete Werte (in Form von DoB-Verteilungen) für das betrach- 
tete Konzept. 


Kategorisierung Allgemein wurden in Bezug auf die Haushaltsdomäne 
und speziell für küchenbezogene Aufgaben unter Beachtung obiger Kompe- 
tenzfragen relevante Begriffe identifiziert, analysiert und kategorisiert. Ei- 
ne erste Unterscheidung fand anhand der in DOLCE definierten Kategorien 
statt. Als Perdurant* wird dabei Vorgängliches? mit untergeordneten Vor- 
gängen und Zustandsaktivitäten unterschieden von Enduranten’, also physi- 
schen Objekten, wie Gegenständen oder Stoffmengen, und nichtphysischen 
Objekten wie Rollen. Für Vorgänge wurden im entwickelten Modell mensch- 
liche Handlungen (Zubereiten, Verzehren, Reinigen, Schneiden, Transpor- 
tieren, etc.) sowie allgemeine Vorgänge (Eingefrieren, Auftauen etc.) als Ka- 
tegorien identifiziert. Als Zustandsaktivitäten wurden menschliche Aktivi- 
täten (Sitzen, Schlafen, Essen von Mahlzeiten, Wohnen etc.) sowie allgemei- 
ne Aktivitäten mit Zustandscharakter (Aufbewahren, Kühlen etc.) als Kate- 
gorien identifiziert. 


* Zur Erinnerung: Entitäten, die in der Zeit existieren. 
2 Im Modell bezeichnet als „VorgänglicherPerdurant“ bzw. in DOLCE englisch „Stative“. 
° Zur Erinnerung: Entitäten, die zu jedem Zeitpunkt existieren. 
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Als physische Objekte werden im Modell unterschiedliche Gegenstände und 
Stoffe‘ modelliert. Stoffe werden in der Domänen-Ontologie anhand ihrer 
Erscheinungsform bei Zimmertemperatur unterschieden, z.B. als Flüssig- 
keiten und Pulver. Als Gegenstände werden gegenständliche Objekte der 
Haushaltsumgebung modelliert. Der OntoClean Methodik [Gua02] folgend 
wurden bei der Modellierung von Gegenstandskonzepten die essentiellen 
Eigenschaften eines Gegenstandes von den möglichen Rollen seiner alltäg- 
lichen Verwendung durch den Menschen unterschieden. Ein Apfel ist bei- 
spielsweise essentiell ein gegenständliches Objekt mit bestimmten Abmes- 
sungen und einer gewissen Masse, aber nicht jeder Apfel ist notwendiger- 
weise Nahrung für ein Lebewesen. Daher wurden Rollen, in welchen Gegen- 
stände für den Menschen im Haushalt dienen, als weitere Kategorie identi- 
fiziert. Rollen (wie Lebensmittel, Möbel etc.) sind dabei als eigene Konzep- 
te modelliert unterhalb der nichtphysischen Objekte in DOLCE. Rollen und 
die Gegenstände, die diese in der Haushaltsdomäne erfüllen, sind im Modell 
über Beziehungen verbunden, welche die Bedeutung eines Gegenstands für 
den menschlichen Alltag zum Ausdruck bringen. 


Taxonomie Wie zuvor erwähnt wurde die OntoClean Methodik [Gua02] 
als grundlegendes Vorgehen zur Strukturierung des Hintergrundwissens- 
modells ausgewählt und angewendet. Dieses Vorgehen definiert ein taxo- 
nomisches Grundgerüst?, welches zunächst nur aus den rigiden Konzepten 
eines Modells besteht. Ein rigides Konzept beschreibt dabei nur Eigenschaf- 
ten, die essentiell für alle Instanzen dieses Konzepts sind [Gua02]. Nach- 
dem dieses Grundgerüst feststeht, werden die weiteren, nicht-rigiden Kon- 
zepte des Modells in das Grundgerüst geeignet eingehängt [Gua04]. Dabei 
gelten Anforderungen an die möglichen taxonomischen Spezialisierungs- 
beziehungen (,is-a“-Beziehungen) zwischen Konzepten, welche Spezialisie- 
rungen zwischen bestimmten Arten von Konzepten verbieten [Gua02]. Die 


* Genauer gesagt werden Stoffe in DOLCE nicht als Substanzen betrachtet, sondern als kon- 
krete Mengen eines Stoffs. Eine Instanz des Konzeptes Wasser, modelliert als Stoff, beschreibt 
somit eine bestimme Menge Wasser, wie einen Liter Wasser oder das Wasser in einem Gefäß. 

2 Im Original: ,backbone taxonomy“ 
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Konzepte eines Modells werden bei diesem Vorgehen zunächst durch Meta- 
Eigenschaften annotiert (wie ob ein Konzept rigide ist etc.). Durch dieses 
Vorgehen kann eine Vereinfachung der taxonomischen Beziehungen zwi- 
schen Konzepten erreicht werden. Teilweise lassen sich komplexe Polyhier- 
archien in klar strukturierte Taxonomien umwandeln, welche als Grund- 
gerüst eine Baumstruktur aufweisen. Die nicht erlaubten Spezialisierungs- 
beziehungen zwischen Konzepten werden durch andersartige Beziehungen 
zwischen den Konzepten ersetzt. 


Dieser Ansatz wurde auch für das Hintergrundwissensmodell umgesetzt. Er 
betrifft hauptsächlich die bereits erwähnte Auftrennung zwischen Gegen- 
ständen und ihren Rollen im menschlichen Alltag. Alle Rollen sind dabei 
als soziale, nichtphysische Objekte' in einer eigenen Teilhierarchie unter- 
halb des Konzepts „MenschlicheRolleFürPhysischesObjekt“ modelliert. Da- 
bei werden z.B. Lebensmittel, Einrichtungsgegenstände, Kleidung, Werk- 
zeuge und Geräte unterschieden. Gegenstände? sind in DOLCE als physische 
Objekte modelliert, neben handelnden Objekten’, welche im entwickelten 
Modell als Konzepte z. B. Lebewesen wie Menschen, Tiere und Pflanzen ent- 
halten sowie Serviceroboter. Reduziert um ihre Rolle im menschlichen All- 
tag könnte der Großteil der gegenständlichen Objekte der Haushaltsdomä- 
ne im Prinzip direkt unterhalb des Konzepts Gegenstand modelliert werden. 
Im entwickelten Modell wird allerdings eine gewisse Strukturierung der re- 
levanten Gegenstände genutzt. Dabei werden natürliche Erzeugnisse (z.B. 
ein Apfel) von Produkten (z.B. eine Tasse) unterschieden. Produkte werden 
der Übersichtlichkeit weiter in Kategorien unterteilt, die beschreiben, ob ein 
Produkt spezielle Eigenschaften besitzt (Elektrogerät, Gefäß etc.) oder für 
welche Anwendung es produziert wurde (Nahrungsprodukt, Reinigungspro- 
dukt etc.). Die Eigenschaft, für eine bestimmte Anwendung produziert wor- 
den zu sein, wird für das Modell somit als rigide angenommen. 


* Objekte, die in ihrer Bedeutung von einer sozialen Gemeinschaft abhängen, wie der mensch- 
lichen Gesellschaft eines bestimmten Kulturkreises. 

2 In DOLCE: „Non-agentive Physical Object“ 

> In DOLCE: „Agentive Physical Object“ 
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Definition Schließlich wurden für die identifizierten Begriffe Konzepte de- 
finiert und formal repräsentiert. Vorgänge haben dabei i. A. Subjekte, welche 
den Vorgang ausführen können (ein Mensch oder ein Serviceroboter, nur 
ein Mensch) sowie Objekte, welche vom Vorgang betroffen sind (ein Gegen- 
stand, ein Mensch etc.). Bei Zustandsaktivitäten werden rein menschliche 
Aktivitäten von anderen Aktivitäten unterschieden. Erstere haben dabei nur 
Menschen als Subjekte und besitzen i. A. keine Objekte. Alle weiteren Zu- 
standsaktivitäten besitzen Objekte. Subjekte und Objekte werden über die 
Beziehungen „hatSubjekt“ und „istVorgangsObjektVon“ modelliert. 


Ebenfalls mittels Beziehungen wird spezifiziert, welche Gegenstände und 
Geräte zur Durchführung eines Vorgangs (z. B. Tafelbesteck beim Verzehren, 
eine Backform zum Backen) oder einer Zustandsaktivität (z.B. Stuhl zum 
Sitzen, Bett zum Schlafen) genutzt werden sowie welche Funktionen von 
Elektrogeräten (z.B. Gefrierschrank zum Eingefrieren) etwas Vorgängliches 
ermöglichen. Zu diesem Zweck dienen die Beziehungen „ermöglichtVor- 
gang“ für Vorgänge und „dientZum“ für Zustandsaktivitäten bzw. ihre in- 
versen Beziehungen. Zusätzlich wird die Funktion von Elektrogeräten über 
die Beziehung „hatFunktion“ modelliert. Gegenstände und Geräte, die bei 
einem Vorgang unterstützen, werden über die Beziehung „ermöglichtUnter- 
stützungBeiVorgang“ beschrieben. Dieses Vorgehen ermöglicht die Model- 
lierung von Wissen über Vorgänge beispielsweise derart, dass ein Backofen 
die Funktion Backen besitzt und das Backen als einen Vorgang ermöglicht, 
welcher durch eine Backform unterstützt wird. 


Gegenstände, welche in bestimmten Rollen dienen, werden über die Bezie- 
hung „dientInRolleAls“ bzw. deren Spezialisierung für Lebensmittel „dien- 
tInRolleAlsLebensmittel“ mit ihren Rollen verbunden. Rollen sind im Gegen- 
zug von diesen Gegenständen abhängig. Weiterhin kann über Beziehungen 
zwischen physischen Enduranten (hauptsächlich Gegenständen und Stof- 
fen) beschrieben werden, 


e in welchen Gefäßen etwas aufbewahrt oder transportiert wird, 
« welche Zutaten und Inhaltsstoffe ein Nahrungsprodukt besitzt sowie 


« welche Produkte verderblich, zu kühlen oder tiefgekühlt sind. 
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4.6.2 Umsetzung 


Nachfolgend wird die Umsetzung des entwickelten Hintergrundwissensmo- 
dells in der Repräsentationssprache OWL vorgestellt, aufgeteilt in die beiden 
Anteile Domänenmodell und Anwendungsmodell. 


Domänenmodell 


Für das Domänenmodell werden die modellierten Qualitäten, Arten von Vor- 
gängen und Objekte der Domäne beschrieben. 


Qualitäten Die Qualitäts-Taxonomie der Domänen-Ontologie ist aus- 
schnittsweise in Abbildung 4.11 dargestellt. Die Abbildung zeigt die defi- 
nierten physischen und temporalen Qualitäten des Modells, nichtphysische 
Qualitäten wurden auf der Ebene des Domänenmodells nicht definiert. 
Als physische Qualitäten werden auf der Ebene des Domänenmodells 
beispielhaft einige Qualitäten modelliert, die grundlegend relevant für die 


Breite 


is-a i = is-a is-a 
q PhysischeQualität D< 


Temperatur 


NichtphysischeQualität Erscheinungsform 


Ortsbezug 


is-a 
TemporaleQualität D< Zeitbezug 


Abbildung 4.11: Modellierte Qualitäten der Domänen-Ontologie im Hintergrundwissensmo- 
dell für die menschliche häusliche Domäne. 


jedi 
998 


jol 
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Haushaltsdomäne sind. Dies betrifft Qualitäten, welche z.B. als perzeptive 
Qualitäten bei der Erkennung von Objekten dienen können, wie deren Ab- 
messungen, Form, Farbe oder Material. Weiterhin wird die Temperatur und 
Erscheinungsform von Objekten modelliert. Die Erscheinungsform wird 
hier bereits auf ein nominales Skalenniveau festgelegt und als Enumeration 
mit einem entsprechenden Wertebereich (fest, flüssig, halbfest, pulvrig, 
gasförmig etc.) definiert. Die Erscheinungsform dient im Domänenmodell 
dabei als eine semantische Qualität, mit welcher Vorwissen im Modell 
hinterlegt wird. Dies betrifft z.B. Aussagen in Bezug auf die Handhabung 
von Stoffen, wie dass Flüssigkeiten oder Pulver unter Zuhilfenahme von 
Gefäßen transportiert werden müssen. 


Perduranten Als Perduranten werden im Domänenmodell nur vorgäng- 
liche Perduranten detaillierter modelliert, keine Ereignisse. Die Kategorie 
der vorgänglichen Perduranten beschreibt dabei Perduranten, welche z.B. 
allgemeine, unspezifische Vorgänge darstellen, wie Sitzen oder Gehen, wo- 
hingegen die Kategorie Ereignisse spezifische Vorgänge beschreibt, wie eine 
Fahrt von Ort A nach Ort B. Zur Modellierung von Vorwissen für die ob- 
jektorientierte Umweltmodellierung sind daher die Kategorie der vorgäng- 
lichen Perduranten sowie ihre beiden untergeordneten Kategorien Vorgang 
und Zustandsaktivität relevant. Die auf der Ebene des Domänenmodells mo- 
dellierten Vorgänge sind in Abbildung 4.12 dargestellt, die Zustandsaktivi- 
täten in Abbildungen 4.13. 


Dabei werden beispielhaft bestimmte menschliche Tätigkeiten und allgemei- 
ne Vorgänge modelliert, die in Beziehung zu relevanten Objekten der Haus- 
haltsdomäne stehen und durch diese Objekte ermöglicht oder unterstützt 
werden. Somit soll Vorwissen über Objekte der Domäne und ihre Bedeu- 
tung im menschlichen Alltag repräsentiert werden. Die modellierten Kon- 
zepte für Vorgänge und Zustandsaktivitäten werden hierfür mittels der oben 
erwähnten Relationen („hatSubjekt“, „istVorgangsObjektVon“, „ermöglicht- 
Vorgang‘, „istFunktionVon“ etc.) axiomatisiert und mit Objekten, bzw. all- 
gemeinen Enduranten, in Beziehung gesetzt. 
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Abbildung 4.13: Modellierte Zustandsaktivitäten auf Ebene des Domänenmodells für die 
menschliche häusliche Domäne. 
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Enduranten und Rollen Die auf der Ebene des Domänenmodells definier- 
ten Enduranten sind in Abbildung 4.14 ausschnittsweise dargestellt, mit ei- 
nem Fokus auf der Kategorie der von Menschen produzierten Gegenstände. 
Die entsprechenden Konzepte sind, neben ihren Relationen zu Vorgängen, 
auch über ihre Beziehungen zu den Rollen, in welchen sie in der Haushalts- 
domäne dienen, axiomatisiert. Hierbei wird die Relation „dientZum“ ver- 
wendet. Die auf der Ebene des Domänenmodells definierten menschlichen 
Rollen, welche als Ziel dieser Relation dienen, sind in Abbildung 4.15 dar- 
gestellt. 


Anwendungsmodell 


Auf der Ebene des Anwendungsmodells wird die entwickelte Ontologie 
für die Haushaltsdomäne um zahlreiche weitere Konzepte für Gegen- 
stände, Stoffe, Rollen, Vorgänge und Zustandsaktivitäten erweitert. Ziel 
ist auch hier, die Bedeutung von Gegenständen und Stoffen, welche für 
küchenbezogene Aufgaben relevant sind, über Beziehungen zu ihren Rol- 
len und ermöglichten Vorgängen zu formalisieren. Insgesamt werden im 
entwickelten Hintergrundwissensmodell über alle Ebenen ungefähr 1000 
verschiedene Klassen mit über 2500 logischen Axiomen modelliert (ohne 
reine Konzeptdefinitionen). 


Anwendungsspezifische Rollen und Enduranten Zu diesem Zweck 
wurden ernährungsspezifische Rollen (Lebensmittel, feste Nahrung, Ge- 
tränk, Genussmittel, Gewürz, Gericht etc.), küchenbezogene Rollen (Besteck 
mit Ess- und Servicebesteck, Reinigungsmittel etc.) sowie weitere allgemei- 
ne Rollen (z.B. Kleidung) in der Ontologie ergänzt. Erfüllt werden diese 
Rollen durch unterschiedliche Stoffe und Gegenstände. Als konkrete Stoffe 
wurden küchen- bzw. ernährungsrelevante Flüssigkeiten (Wasser, Milch 
etc.), Pulver (Mehl, Salz, Pfeffer etc.), halbfeste Stoffe (Joghurt, Honig etc.) 
sowie Inhaltsstoffe (Koffein, Alkohol, Vitamin, Natrium etc.) modelliert. Als 
relevante Gegenstände wurden natürliche Erzeugnisse (Ei, verschiedene 
Obst- und Gemüsesorten etc.), gegenständliche Nahrungsprodukte (Brot, 
Brötchen, Wurst-, Fleisch- und Käsesorten, Säfte etc.), konkrete Geschirr- 
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Abbildung 4.14: Ausschnitt der modellierten Gegenstände in der Domänen-Ontologie für die 
menschliche häusliche Domäne. 


und Besteckanteile (Teller, Tassen, Töpfe, Schalen, Gefäße, Gabeln, Messer 
etc.) sowie Elektrogeräte (Kühlschrank, Toaster, Herd, Mixer, Staubsauger) 
modelliert. Auch bautechnische Konstruktionen (Zimmer, Wand, Tür, 
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Abbildung 4.15: Ausschnitt der modellierten Rollen in der Domänen-Ontologie fiir die 
menschliche häusliche Domäne. 


Fußboden etc.) wurden ergänzt. Für die semantische Beschreibung die- 
ser Gegenstände und Stoffe wurden weitere küchenbezogene Relationen 
ergänzt („hatInhaltsstoff“, „hatZutat“, „wirdAufbewahrtIn“ etc.). 


Zusätzliche Perduranten Ebenfalls wurden weitere Vorgänge für Kü- 
chenaufgaben definiert (Auftauen, Eingefrieren, Aufspießen, Schöpfen, Ba- 
cken, Braten) bzw. existierende Vorgänge spezialisiert (Schneiden von Brot, 
Schneiden von Obst, Aufbrühen von Kaffee, Aufbrühen von Tee etc.). Diese 
Spezialisierung erfolgte in Fällen, wo dies einer Präzisierung der Verwen- 
dung von Objekten im Küchenalltag diente („Brotmesser“ gegenüber „Käse- 
messer“). Ähnlich wurde für Zustandsaktivitäten verfahren (z.B. in Bezug 
auf das Aufbewahren unterschiedlicher Arten von Lebensmitteln). 


Qualitäten Weiterhin wurden zusätzliche Qualitäten in das Anwendungs- 
modell aufgenommen. Mittels dieser Qualitäten kann beispielsweise der 
Nährwert oder die Schädlichkeit von Stoffen und Gegenständen beschrie- 
ben werden, wenn diese als Lebensmittel genutzt werden. Ebenso kann der 
Wassergehalt bzw. Alkoholgehalt repräsentiert werden. Diese Qualitäten 
dienen im Anwendungsfall des entwickelten Hintergrundwissensmodells 
als semantische Qualitäten, mit welchen Vorwissen im Modell repräsentiert 
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wird. Im Speziellen erméglichen sie die Definition von Sammelkategorien, 
welche eine sprachliche Bedeutung im menschlichen Alltag haben, z.B. 
die Kategorie der alkoholischen Getränke oder die Unterscheidung von 
Nahrungsmitteln gegenüber Genussmitteln. 


Als weitere Qualitäten werden die Ortsfestigkeit eines Gegenstandes sowie 
dessen üblicher Ort definiert. Die Ortsfestigkeit beschreibt dabei mittels ei- 
nes nominalen Attributs, ob für einen Gegenstand angenommen werden 
kann, dass dieser über die Zeit am gleichen Ort verbleibt (Wert „ortsfest“), 
dies zumindest annähernd gilt („annähernd ortsfest“) oder nicht gilt („orts- 
variabel“). Der übliche Ort beschreibt eine Ortsangabe für den Fall, dass man 
nach einem Gegenstand einer bestimmten Art sucht. Beide Qualitäten die- 
nen im Anwendungsfall sowohl als semantische als auch als deduktive Ei- 
genschaften: einerseits ermöglichen sie, klassenspezifisches Vorwissen ins 
Hintergrundwissensmodell einzubringen (ein Schrank ist ortsfest, ein Stuhl 
annähernd ortsfest, Kaffeetassen sind ortsvariabel), andererseits können, als 
eine Art des Konzeptlernens, entsprechende Informationen mit der Zeit als 
Erfahrungswissen aus der Historie des Weltmodells abgeleitet werden (z.B. 
der übliche Ort, an welchem eine Küchenrolle aufbewahrt wird). 


Als perzeptive Qualitäten für die Anwendung dienen Spezialisierungen der 
im Domänenmodell definierten Qualitäten Farbe, Form, Formfaktor, Abmes- 
sungen und Material. Zur Beschreibung der Farbe von Objekten wird die 
Qualität Farbe des Domänenmodells in zwei zusätzliche Qualitäten, eine Pri- 
märfarbe und eine Sekundärfarbe, spezialisiert. Beide Farbqualitäten wer- 
den dabei symbolisch auf einem nominalen Skalenniveau beschrieben. Die 
Qualität Material wird ebenfalls in ein Primär- und Sekundärmaterial spe- 
zialisiert und symbolisch auf nominalem Skalenniveau beschrieben. Auch 
die Qualität Form wird auf nominalem Skalenniveau beschrieben. Zusätz- 
lich werden weiterhin mehrere Formfaktoren definiert, welche jeweils be- 
stimmte Aspekte der Objektform als stetige Merkmale intervallskaliert be- 
schreiben. Die Abmessungen eines Objektes werden in Form eines quader- 
förmigen Hüllkörpers über die drei Qualitäten Tiefe, Breite und Höhe jeweils 
verhältnisskaliert beschrieben. 
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Probabilistische Modellierung Die schrittweise Erstellung eines Hinter- 
grundwissensmodells der objektorientierten Umweltmodellierung ermög- 
licht es, zunächst ein relationales Modell der Domäne zu definieren und die- 
ses anschließend um probabilistische Aspekte wie unsichere Attribute und 
Relationen zu erweitern. Für die Erstellung des Hintergrundwissensmodells 
für Haushaltsaufgaben wurde ebenfalls eine schrittweise Herangehensweise 
gewählt. Die vorausgehende Beschreibung des erstellten Domänen- und An- 
wendungsmodells betraf dabei den relationalen Anteil. Auf dieser Grundlage 
können nun probabilistische Attribute zu den definierten Konzepten hinzu- 
gefügt werden. Dabei wurden zunächst, wie im Abschnitt 4.5 beschrieben, 
nur Blattkonzepte der Generalisierungshierarchie betrachtet. 


Die probabilistische Modellierung erfolgte dabei in Abhängigkeit der im re- 
lationalen Modell definierten Skalenniveaus und Wertebereiche je Qualität. 
Für nominale Qualitäten wie Farbe, Form und Material wurden z.B. entspre- 
chende Attribute mit diskreten Wahrscheinlichkeitsverteilungen modelliert. 
Für kardinal skalierte Qualitäten wie die Abmessungen oder Formfaktoren 
wurden Attribute mit Normalverteilungen oder Gaußmischverteilungen de- 
finiert. Wie bereits erwähnt werden probabilistisch modellierte Attribute 
in der Kern-Ontologie in Form von semantischen Netzen dargestellt. Ab- 
bildung 4.16 illustriert beispielhaft die Anteile, die für eine probabilistische 
Modellierung eines Attributs festgelegt werden müssen. Dabei wird die Mo- 
dellierung der kardinalen Qualität Breite für das Konzept Gabel mittels eines 
normalverteilten Attributs dargestellt. 


Ein konkretes Attribut stellt sich dabei als das semantische Netz von Instan- 
zen zu den entsprechenden Konzepten der Kern-Ontologie dar. Instanzen 
sind in der Abbildung als rote Rechtecke dargestellt, ihre Konzepte als gelbe 
Ellipsen und Datenwerte in grün. Die Verteilung der möglichen Breite-Werte 
einer Gabel wird dabei über eine Instanz der Qualität Breite („Breite-Gabel“) 
dargestellt, zu welcher das Konzept Gabel in einer Relation des Typs „besitzt- 
Qualität“ steht. Die Breite-Instanz selbst steht in Relation „hat Attribut“ zur 
Instanz „Att(ribut)-Breite-Gabel“ eines verhältnisskalierten Attributs. Diese 
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Abbildung 4.16: Probabilistische Modellierung der kardinalen Qualität Breite für das Konzept 
Gabel mittels eines normalverteilten Attributs im Anwendungsmodell für die 
menschliche häusliche Domäne. Die konkrete Breite einer Gabel wird in Form 
eines semantischen Netzes für die Instanz „Breite-Gabel“ der Qualität Breite 
repräsentiert. Dabei werden weitere Instanzen für Attribute, Wertebereiche, 
Maßeinheiten etc. zur Beschreibung der konkreten Qualität referenziert. In- 
stanzen sind in der Abbildung als rote Rechtecke dargestellt, ihre Konzepte 
als gelbe Ellipsen und Datenwerte in grün. 


Attribut-Instanz besitzt weitere Relationen zu einer Einheiten-Instanz („Zen- 
timeter“) sowie zur Instanz „NV-Breite-Gabel“, welche die gewünschte Nor- 
malverteilung mit entsprechenden Datenwerten darstellt. 


Derartige semantische Netze zur Darstellung von probabilistischen Attri- 
buten können automatisch erstellt und dem Wissensmodell hinzugefügt 
werden, wenn eine mathematische Beschreibung der Wahrscheinlichkeits- 
verteilung vorliegt (in zur Kern-Ontologie kompatibler Form) sowie die re- 
ferenzierte Qualität und die entsprechende Domäne-Entitäten gegeben sind 
(vgl. Abschnitt 4.4.3 zur interoperablen Bereitstellung von Beobachtungen). 
Ebenfalls kann die Wahrscheinlichkeitsverteilung eines probabilistischen 
Attributs aus dem Wissensmodell automatisiert in eine mathematische 
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Form überführt werden, welche dann z.B. von anderen Komponenten des 
kognitiven Systems sowie im Umweltmodell selbst weiterverwendet werden 
kann (z.B. zur quantitativen Modellbewertung). 


Wie in Abschnitt 4.5.2 beschrieben, muss eine probabilistische Modellierung 
in einem Hintergrundwissensmodell der objektorientierten Umweltmodel- 
lierung zwingend zunächst nur für diejenigen Konzepte erfolgen, welche 
durch Repräsentanten im Weltmodell instanziiert werden könnten. Dies 
betrifft i. A. die Blattkonzepte der Taxonomie. Zur Modellierung von pro- 
babilistischen Attributen für relevante Konzepte wurde der ebenfalls in 
Abschnitt 4.5.2 vorgeschlagene Ansatz einer stichprobenbasierten Model- 
lierung genutzt. Für Details zu dieser probabilistischen Modellierung für die 
oben genannten perzeptiven Qualitäten im Anwendungsfall der Haushalts- 
umgebung mit Küchenaufgaben sei auf Abschnitt 8.5.1 verwiesen. Dort wird 
die probabilistische Modellierung ausgewählter gegenständlicher Objekte 
als Konzepte im Rahmen des Demonstration-Szenarios der quantitativen 
Modellbewertung beschrieben. 


Dieses Vorgehen lässt sich auch auf semantische Attribute übertragen, für 
die eine ausreichende Menge an Beispielwerten ermittelt werden kann. Dies 
betrifft z. B. numerisch repräsentierte Qualitäten wie den Nährwert oder den 
Alkoholgehalt von Lebensmitteln. Ebenso lässt sich das Vorgehen auf Qua- 
litäten übertragen, für welche grundsätzliches unsicheres Vorwissen reprä- 
sentiert werden soll. Dies betrifft z.B. die üblichen Orte für Gegenstände als 
solche Positionen, die entweder an sich nicht mit hoher Präzision angegeben 
werden können (Varianz) oder, bzw. zusätzlich, sich über die Zeit durch Al- 
ternativen auszeichnen (Multimodalität). Hier können z.B. Gaußmischver- 
teilungen zur Repräsentation derartigen Vorwissens genutzt werden. Analog 
können Wahrscheinlichkeitsverteilungen für im Anwendungsfall deduktiv 
verwendete Attribute aus über die Zeit gesammelten Informationen als Er- 
fahrungswerte abgeleitet werden. 
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4.7 Zusammenfassung 


In diesem Kapitel wurde das fiir diese Arbeit entworfene Vorgehen zur 
Erstellung von Hintergrundwissensmodellen fiir die objektorientierte Um- 
weltmodellierung vorgestellt und demonstriert. Dazu wurden zunächst 
die Anforderungen der objektorientierten Umweltmodellierung an ihre 
Hintergrundwissensmodelle erfasst, analysiert und dem Stand der Technik 
gegenübergestellt. Für die spezifischen Anforderungen der objektorien- 
tierten Umweltmodellierung, wie einer probabilistischen Repräsentation 
von Attributen auf unterschiedlichen Skalenniveaus, wurde ein eigenes 
Metamodell definiert und in OWL 2 DL umgesetzt. Zur Strukturierung 
der Inhalte eines Hintergrundwissensmodells wurde weiterhin mit DOLCE 
eine Top-Level Ontologie mit der Umsetzung des Metamodells integriert. 
Das integrierte Modell stellt dabei eine Kern-Ontologie für die objektori- 
entierte Umweltmodellierung dar. Diese Kern-Ontologie dient im Weiteren 
auch als Voraussetzung für eine adaptive Umweltmodellierung, da sie den 
Hypothesenraum für neu zu lernende Konzepte definiert. Aufbauend auf 
dieser Kern-Ontologie wurde ein schrittweises Vorgehen zur Erstellung 
von Domänenmodellen für die objektorientierte Umweltmodellierung vor- 
geschlagen, schrittweise sowohl in Bezug auf die Spezialisierungsebene 
von Modellen als auch bzgl. der Nutzung von relationalen Modellen als 
Grundlage für die probabilistische Modellierung. Die Anwendbarkeit der 
Kern-Ontologie und des Vorgehens zur Modellerstellung wurden schließlich 
mit einem Hintergrundwissensmodell als Anwendungsbeispiel im Bereich 
der Servicerobotik für Haushaltsaufgaben demonstriert. 
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In diesem Kapitel soll die probabilistische Informationsverwaltung und 
-verarbeitung der objektorientierten Umweltmodellierung dargelegt wer- 
den. Viele der dargestellten Aspekte betreffen dabei Anteile, welche in 
Vorarbeiten [Ghe08, Bel09, Ghe10b, Ghe10a, Hei10, Bau10] sowie anderen 
Arbeiten wie [Bel17] vorgeschlagen oder im Detail betrachtet werden. In 
dieser Arbeit und in diesem Kapitel werden nun spezifische Ziele diesbeziig- 
lich verfolgt. Ein Ziel ist es dabei, das Thema der Informationsverwaltung 
möglichst ganzheitlich zu betrachten und seine verschiedenen Aspekte 
integriert darzustellen. Dies soll unter Bezug und expliziter Verwendung 
des vorgeschlagenen Metamodells für das Hintergrundwissen und seiner 
definierten Konzepte erfolgen. Weiterhin sollen auch Stellen innerhalb der 
Informationsverwaltung identifiziert werden, welche als Ansatzpunkte für 
eine adaptive Umweltmodellierung und speziell das Lernen aus erwor- 
benen Umgebungsinformationen relevant sind. Für die probabilistische 
Informationsverarbeitung, einem Teil der Informationsverwaltung im ob- 
jektorientierten Umweltmodell, ist es weiterhin das Ziel, diese als einen 
ganzheitlichen Ablauf und in einer durchgängigen formalen Repräsentation 
darzustellen. In dieser integrativen Darstellungen werden an passenden 
Stellen zugleich eigene Ergänzungen durch konkrete Beispiele, Detaillie- 
rungen und, falls notwendig, eigene Anpassungen oder Erweiterungen 
eingeführt. Ersteres betrifft beispielsweise die Unterscheidung und unter- 
schiedliche Handhabung der verschiedenen Arten von Attributen, welche 
im Metamodell des Hintergrundwissens in dieser Arbeit eingeführt wurden. 
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Dieses Kapitel ist wie folgt strukturiert. In Abschnitt 5.1 werden die Grund- 
lagen der probabilistischen Informationsverarbeitung im objektorientierten 
Umweltmodell beschrieben. Beitrage dieser Arbeit beinhalten hier Detail- 
lierungen, die Verbindung zum Metamodell, konkrete Beispiele und eine 
durchgängige Notation. Abschnitt 5.2 geht spezifisch auf die Datenassozia- 
tion ein, die einen wichtigen Teil der Informationsverarbeitung darstellt. Ei- 
gene Beiträge bestehen hier aus einer Erweiterung und Anpassung des Vor- 
gehens zur Datenassoziation. Anschließend wird in Abschnitt 5.3 die allge- 
meine Informationsverwaltung im Umweltmodell beschrieben, welche Re- 
präsentanten und Relationen betrifft. Die Beiträge dieser Arbeit beinhalten 
hier ein alternatives Vorgehen zur Erzeugung neuer Repräsentanten, abge- 
stimmt auf die angepasste Datenassoziation, sowie eine Konzeption für die 
Verwaltung von Relationen. Abschnitt 5.4 behandelt schließlich das Thema, 
wie erworbene Umgebungsinformationen längerfristig gespeichert und aus 
ihnen Erfahrungswerte gelernt werden können. Die Beiträge dieser Arbeit 
bestehen dabei in einer strukturierten Diskussion dieses Themas. 


5.1 Probabilistische 
Informationsverarbeitung 


Im objektorientierten Umweltmodell findet eine probabilistische Verarbei- 
tung der erfassten Umweltinformationen statt. Basis dieser Informationsver- 
arbeitung ist die probabilistische Informationsrepräsentation. Die probabi- 
listische Informationsverarbeitung umfasst im objektorientierten Umwelt- 
modell alle Operationen, die der Weiterverarbeitung der über die betrach- 
tete Umgebung erworbenen Informationen dienen und die nach probabi- 
listischen Prinzipien erfolgen. Die Informationsverarbeitung erfolgt unter 
Verwendung eines Zustandsraummodells für dynamische Anteile sowie un- 
ter Verwendung von DoB-Verteilungen zur Modellierung von Vorwissen. Im 
Weltmodell wird mittels der enthaltenen Repräsentanten und deren Bezie- 
hungen der aktuelle Zustand der beobachteten Umgebung eines kognitiven 
Systems repräsentiert. Das objektorientierte Umweltmodell arbeitet als ein 
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zeitdiskretes System, welches in jedem Zeitschritt ein Verarbeitungssche- 
ma durchlauft. Die wichtigsten Schritte dieses Verarbeitungsschemas wer- 
den nachfolgend im Überblick dargelegt. Anschließend wird die formale ma- 
thematische Repräsentation der probabilistischen Informationen für dieses 
Kapitel definiert und mittels dieser Repräsentation zwei der wichtigsten Ver- 
arbeitungsschritte detaillierter dargestellt. 


5.1.1 Grundlegendes Verarbeitungsschema 


Im Weltmodell werden eingehende Informationen zeitdiskret verarbeitet. 
Trifft in einem Zeitschritt tg eine neue Beobachtung zu einer Domänen- 
Entität ein, so erfolgen verschiedene Verarbeitungsschritte. Diese Verarbei- 
tungsschritte betreffen 


« die zeitliche Fortschreibung existierender Informationen, 

« die Zuordnung einer Beobachtung zu existierenden Informationen 

e und die entsprechende Aktualisierung dieser Informationen. 
Zunächst erfolgt eine zeitliche Fortschreibung (Prädiktion) des bisherigen 
Zustands des Weltmodells auf den aktuellen Zeitpunkt. Dies betrifft zunächst 
einmal alle im Weltmodell enthaltenen Repräsentanten. Dann wird versucht, 
die neue Beobachtung einem der Repräsentanten zuzuordnen (sog. Daten- 
assoziation). Aufgrund dieser Zuordnung erfolgt dann eine Aktualisierung 
des Zustands im Weltmodell, bei welcher die Informationen der neuen Beob- 
achtung mit den bisherigen Informationen im Weltmodell fusioniert werden 
oder ein neuer Repräsentant erzeugt wird. Im Anschluss an diese in jedem 
Zeitschritt durchgeführten Verarbeitungsschritte können weitere Schritte 
erfolgen. Diese weiteren Schritte betreffen 

« die Aktualisierung der Typzuordnung für Repräsentanten, 

« die Aktualisierung von Relationen zwischen Repräsentanten, 

« die Prüfung, ob Repräsentanten zu löschen oder archivieren sind und 


e allgemeine Qualitätsprüfungen. 
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Durch die in dieser Arbeit entwickelte adaptive Umweltmodellierung kom- 
men noch weitere Schritte hinzu, welche die Bewertung der Modellqualitat 
in Bezug auf die zu einem Zeitschritt im Weltmodell enthaltenen Reprasen- 
tanten sowie etwaige Modellanpassungen betreffen. 


Die zuletzt genannten weiteren Schritte stellen im grundlegenden Verar- 
beitungsschema optionale Schritte dar, in dem Sinne, dass sie nicht in je- 
dem Zeitschritt notwendigerweise ausgeführt werden müssen. Sie können 
alternativ regelmäßig, aber mit verringerter Frequenz ausgeführt werden. 
Auch eine ereignisgetriebene Ausführung kann sinnvoll sein, wobei z.B. ei- 
ne externe Informationsabfrage als ein solches Ereignis dienen kann. Wann 
und mit welcher Häufigkeit diese weiteren Verarbeitungsschritte ausgeführt 
werden, ist dabei abhängig vom Anwendungsfall und dessen Anforderungen 
z.B. an eine Echtzeitfähigkeit des Umweltmodells. Dies stellt immer auch ei- 
ne Abwägung gegenüber der Aktualität der repräsentierten Informationen 
dar. In Abschnitt 5.3.5 wird das genannte Verarbeitungsschema weiter de- 
tailliert, vor allem bzgl. der Verwaltung von Repräsentanten und Relationen. 


Die Basiseinheiten der Informationsverarbeitung im Großteil der Verarbei- 
tungsschritte stellen Attribute dar. Die für die objektorientierte Umwelt- 
modellierung definierten Attribute können sich in verschiedenen, für eine 
Verarbeitung relevanten Aspekten unterscheiden, z.B. in ihrem Skalenni- 
veau oder ihrem Szenarmodus’*. Auf diese Unterschiede wird nachfolgend 
an denjenigen Stellen, wo eine Unterscheidung notwendig ist, hingewiesen. 
Dabei werden auch entsprechend unterschiedliche Vorgehen genannt. Dar- 
über hinaus wird die Behandlung von Attributen, soweit wie möglich, ein- 


heitlich dargestellt. 


Nach dem Metamodell der objektorientierten Umweltmodellierung (vgl. 4.3) besitzen nicht 
Attribute, sondern die von ihnen referenzierten Qualitäten ein Skalenniveau und einen Szen- 
armodus. Da jedes Attribut aber genau eine Qualität referenziert, wird hier verkürzend auch 
vom Skalenniveau bzw. Szenarmodus eines Attributs gesprochen. 
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5.1.2 Formale Informationsrepräsentation 


An dieser Stelle sollen nochmals die grundlegenden Begriffe der objektorien- 
tierten Umweltmodellierung genannt und in Relation gesetzt werden sowie 
die in dieser Arbeit verwendete formale Repräsentation dieser Begriffe und 
Konzepte vorgestellt werden. Im Gegensatz zur formalen Darstellung von 
Vorwissen in der Wissensmodellierung steht in diesem Kapitel die mathe- 
matische Repräsentation der entsprechenden Verarbeitungsschritte im Vor- 
dergrund. Diese setzt naturgemäß ebenfalls auf etablierten Prinzipien und 
Modellelementen der objektorientierten Umweltmodellierung auf, z.B. auf 
Repräsentanten und deren Attributen. 


Notation Dabei werden folgende Notationskonventionen genutzt: 


« Zufallsvariablen werden fett dargestellt: x , 

e Vektoren werden unterstrichen: x , 

e Mengen werden in kalligraphischen Großbuchstaben dargestellt: R , 
e Matrizen werden fett und in Großbuchstaben dargestellt: H , 


« Dichtefunktionen von Zufallsvariablen werden mit Bezug zur Zufalls- 
variable als p,(x) oder kurz als p(x) dargestellt, 


e bedingte Dichten werden (kurz) als p(y|x) dargestellt, 
« Realisierungen von Zufallsvariablen werden als dargestellt, 


« Ereignisse werden mit Großbuchstaben beschrieben, z.B. als E, das 
Mengenkomplement eines Ereignisses wird als E dargestellt. 


Überblick 


Die grundlegenden Begriffe der objektorientierten Umweltmodellierung 
und deren formale Darstellung mittels mathematischer Variablen wird in 
Tabelle 5.1 zusammengefasst. In der Weltmodell-Komponente des objekt- 
orientierten Umweltmodells werden beobachtete Domänen-Entitäten über 
Repräsentanten dargestellt. Ein Repräsentant wird formal als Symbol r 
dargestellt. Jeder Repräsentant wird über seine Attribute beschrieben. Ein 
Attribut a eines Repräsentanten r wird formal als a”dargestellt. In der 
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Hintergrundwissens-Komponente des objektorientierten Umweltmodells 
werden Konzepte definiert, welche Typen von Domänen-Entitäten re- 
präsentieren. Ein Konzept wird formal mit dem Symbol c dargestellt. In 
der probabilistischen Darstellung werden Attribute als Zufallsvariablen 
a aufgefasst mit ihren entsprechenden DoB-Verteilungen, dargestellt als 
Dichtefunktionen p(a). Auch Repräsentanten r und Konzepte c können als 
Zufallsvariablen aufgefasst werden mit entsprechenden Dichtefunktionen 
wie z.B. p(r) für einen Repräsentanten. 


Tabelle 5.1: Grundlegende Begriffe der Umweltmodellierung und ihre formale Darstellung. 


Begriff Symbole Dichte 
Repräsentant r Pr), p(r) 
Konzept c Pe(c), p(c) 


Attribut a, a” Pala), p(a”) 

Existenz-Attribut e", E" p(e’), p(E”) 
Typ-Attribut cr p(elr) 

Assoziationsvariable | dķ, Dk | p(dx), p(Dx) 


Szenarmodus von Attributen Im Metamodell des Hintergrundwissens 
werden unterschiedliche Szenarmodi fiir Attribute unterschieden. Fir 
perzeptive Attribute, deren Werte aufgrund von Sensorbeobachtungen 
bestimmt werden, gilt das oben genannte schritthaltende Verarbeitungs- 
schema. Deduktive Attribute werden aus den Werten anderer Attribute 
bestimmt, nicht direkt aufgrund von Sensorbeobachtungen. Dies bedeutet, 
dass ihre Werte frühestens in den weiteren Schritten des Verarbeitungs- 
schemas bestimmt werden. Genau genommen muss hier nach der Art und 
Weise unterschieden werden, wie ein deduktives Attribut bestimmt wird. 
Wird ein deduktives Attribut z.B. aus den aktuellen Werten perzeptiver 
Attribute bzw. dem aktuellen Zustand abgeleitet, so kann eine schritthal- 
tende Aktualisierung sinnvoll sein. Wird es dagegen aus einer Historie von 
Werten abgeleitet, so kann eine regelmäßige Aktualisierung mit geringerer 
Frequenz bzw. eine Aktualisierung bei Bedarf sinnvoll sein. Semantische 
Attribute stellen Vorwissen dar und werden aus dem einem Repräsentanten 


176 


5.1 Probabilistische Informationsverarbeitung 


zugeordneten Konzept abgeleitet. Hier erfolgt i. A. eine Aktualisierung nur 
dann, wenn sich das zugeordnete Konzept ändert. 


Spezielle Attribute Jeder Repräsentant besitzt zwei Attribute, die eine spe- 
zielle Semantik innehaben und daher auch eine spezielle Behandlung erfor- 
dern [Ghe10a]. Dies ist einerseits das Attribut, dass die Existenzwahrschein- 
lichkeit eines Repräsentanten darstellt, und andererseits das Typ-Attribut, 
welches die Zuordnung des Repräsentanten zu seinem Konzept im Hinter- 
grundwissen im Sinne einer Klassifikation darstellt. Ein Existenz-Attribut 
wird dabei über eine binäre Zufallsvariable e” € {0,1} repräsentiert, wel- 
che die Wahrscheinlichkeit beschreibt, dass der Repräsentant r aktuell zu 
einer realen Entität in der relevanten Umwelt korrespondiert. Diese Wahr- 
scheinlichkeit wird nachfolgend als Existenzwahrscheinlichkeit bezeichnet. 
Ein Typ-Attribut c” beschreibt dagegen den Typ von Entität, welche ein Re- 
präsentant darstellt. Der Wertebereich eines Typ-Attributs ist somit die Men- 
ge der im Hintergrundwissen modellierten Konzepte (bzw. eine Teilmenge 
davon). Typ-Attribute speichern das Ergebnis der Repräsentant-zu-Konzept 
Zuordnung p(clr), einer Art von probabilistischer Klassifikation, und sind 
die Basis fiir eine sog. wissensbasierte Vervollstandigung von Reprasentan- 
ten, also dem Ableiten der Werte fiir semantische Attribute. Zur sprachlichen 
Unterscheidung der allgemeinen Attribute eines Repräsentanten von seinem 
Existenz- und Typ-Attribut werden die allgemeinen Attribute in Vorarbei- 
ten als deskriptive Attribute bezeichnet [Ghe10a]. Diese Bezeichnung wird 
nachfolgend so übernommen. Neben Repräsentanten besitzen auch proba- 
bilistische Relationen ein Existenz-Attribut. Ihre Typisierung erfolgt jedoch 
deterministisch. 


Probabilistische Repräsentation von Repräsentanten 


In formaler Notation [Ghe10a] kann ein Repräsentant r mittels seiner n At- 
tribute a”! durch die gemeinsame Wahrscheinlichkeitsverteilung 


pEr) ea (5.1) 
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beschrieben werden. Deskriptive Attribute und das Typ-Attribut sind nur 
unter der Bedingung von Interesse, dass eine zum Repräsentanten korres- 
pondierende Realwelt-Entität als existent angenommen wird, d.h. die Exis- 
tenzvariable e" den Wert 1 annimmt. Mit der Abkürzung E” := (e” = 1) 
ergibt sich’ 


pr) = ple ae 1,0" |B) - pŒ”) . (5.2) 


Unter Ausnutzung der Annahme der (bedingten) stochastischen Unabhän- 
gigkeit der deskriptiven Attribute lässt sich die Verteilung eines Repräsen- 
tanten weiter faktorisieren. Mit a” := [a"} a" ..., a"*]T? ergibt sich 


pr) = p(c’|a’, E"). (Treen) - p(B’) . (5.3) 
i=1 


Die Werte bzw. Wahrscheinlichkeitsverteilungen der Attribute von Reprä- 
sentanten ergeben sich aus den Informationen, welche mittels Sensorbeob- 
achtungen der relevanten Umwelt an das objektorientierte Umweltmodell 
bereitgestellt werden. Eine im Zeitschritt tg gemachte Beobachtung 

Ye DE (5.4) 
besteht dabei aus s einzelnen Messungen pi der durch die gegebenen Sen- 
soren beobachtbaren Qualitäten einer Entität. Die Wahrscheinlichkeitsver- 
teilung p(r,) eines Repräsentanten r im Zeitschritt tg hängt dabei von allen 
bis zu diesem Zeitpunkt gemachten Beobachtungen, zusammengefasst im 
Vektor J,.,, ab. Somit ergibt sich unter Angabe dieser Bedingungen für die 


1 Hier wird explizit P(c’, alah, a™n|er= 0) = 0 angenommen. 
? Zufallsvektor mit diskreten und stetigen Zufallsvariablen 
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Wahrscheinlichkeitsverteilung eines Repräsentanten die Darstellung 
P Can uk) = 


n 
p (cla? , Ek, Pa:k) - (licen) - p(Erldı:k) - (655) 
i=1 


Hier und im Folgenden wird bei der Notation der deskriptiven Attribute a” 
der Übersichtlichkeit halber auf den Bezug zum Repräsentanten r verzichtet, 
solange dieser aus dem Kontext hervorgeht. 


5.1.3 Informationsalterung 


Die beobachtete Umgebung eines kognitiven Systems ist zeitlichen Verände- 
rungen ausgesetzt [Ghe10a, Hei10]. Dies kann sich z. B. im Auftauchen oder 
Verschwinden von Domänen-Entitäten in der beobachteten Umgebung äu- 
ßern, oder darin, dass sich die Eigenschaften von Domänen-Entitäten mit 
der Zeit ändern, z.B. ihre Position. Somit verlieren einmal erworbene und 
im Umweltmodell repräsentierte Informationen mit der Zeit einen Teil ih- 
rer Gültigkeit. Diesem Fakt wird durch eine zeitliche Fortschreibung der im 
Weltmodell repräsentierten Informationen Rechnung getragen. Diese Fort- 
schreibung wird in der objektorientierten Umweltmodellierung als Informa- 
tionsalterung bezeichnet und betrifft die Existenz von Repräsentanten sowie 
ihre deskriptiven Attribute. 


Fortschreibung der Existenzwahrscheinlichkeit 


In jedem Zeitschritt reduziert sich nach diesem Prinzip die Existenzwahr- 
scheinlichkeit eines Repräsentanten. Wird dieser Repräsentant im selben 
Zeitschritt erneut beobachtet, so erhöht sich seine Existenzwahrscheinlich- 
keit wieder, wie in Abschnitt 5.2 beschrieben. Zur Berechnung des Abklin- 
gens der Existenzwahrscheinlichkeit p(E”) für den Zeitschritt tọ (notiert als 
EX) auf Basis der Existenzwahrscheinlichkeit p(Ek_ı) des vorhergehenden 
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Zeitschritts t;_, werden die Ubergangswahrscheinlichkeiten’ [Ghe10a] 


p(ERIEk-ı) = fe, (5.6) 
P(Ex\Er_1) = 0, (5.7) 


Il 


genutzt, wobei 6, eine klassenspezifische Abklingkonstante mit 0 < 6, < 1 
beschreibt. Damit ergibt sich fiir die zeitliche Fortschreibung der Existenz- 
wahrscheinlichkeit insgesamt die Formel 


p( |Jı:r-ı ) = ße P(E, | Yaka) > (5.8) 


wobei ,.,_, hier alle bis zum Zeitpunkt t,_, gemachten Beobachtungen 
beschreibt?. Dieses Modell beschreibt dabei eine exponentielle Abnahme der 
Existenzwahrscheinlichkeit um den Faktor fç, welcher vom Typ der Entitat 
abhängt, d. h. vom dem Repräsentanten zugeordneten Konzept c = c”. Die- 
ser Alterungsfaktor kann zusammengesetzt sein [Bel09, Hei10], z.B. als 


Be = Bo + Be + Bs ’ (5.9) 


so dass sich der resultierende Alterungsfaktor 6, für Instanzen eines Kon- 
zepts c ergibt aus einem Basisfaktor fọ, dem klassenspezifischen Alterungs- 
faktor ß. sowie einem weiteren Korrekturfaktor B,, mit welchem dem aktu- 
ellen Situationskontext Rechnung getragen werden kann. 


Weiterhin sei angemerkt, dass durch die Verwendung eines klassenspezifi- 
schen Alterungsfaktors 8, eine Abhängigkeit zwischen der Typzuordnung 
p (clr) eines Repräsentanten und der Fortschreibung seines Existenz- 
Attributs entsteht. Dies kann dabei bewirken, dass sich unter einer ge- 
änderten Typzuordnung (z.B. aufgrund einer Aktualisierung) auch das 
Alterungsverhalten eines Repräsentanten ändert. 


* Analog zu E" werden hier die Abkürzungen EL := (eg = 1) und EL := (ef = 0) 
verwendet. 


? Die Wahrscheinlichkeit p(E}|J1ı:k-ı) ergibt sich dabei als 1 — p(Er|Jı:k-ı)- 
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Pradiktion von deskriptiven Attributen 


Auch fiir die weiteren im Weltmodell gespeicherten deskriptiven Attribu- 
te wird in Vorarbeiten eine Alterung vorgeschlagen [Ghe08]. Konkret wird 
dazu der Prädiktionsschritt eines Bayes’schen Schätzers genutzt [Ghe10a, 
Bau10]. Zur Berechnung der auf den Zeitschritt tg prädizierten Verteilung 
des Attributs a? eines Repräsentanten wird hier die Chapman-Kolmogorov 
Gleichung 


PlaklER- Su) = f plaklak.ı ER) + pak aIBESx-1) dah 


(5.10) 


gelöst. Als Modell für die Transitionswahrscheinlichkeit p(ailai_,,EX) ei- 
nes Attributs kann z.B. die Identitätsfunktion mit additivem Gauß’schen 
Rauschen angenommen werden, welches dann zu einer zeitlichen Erhöhung 
der Unsicherheit der Attributverteilung führt. Die Prädiktion des Attribut- 


r 
k 
ten stochastischen Unabhängigkeit der einzelnen Attribute und nach (5.3) 


vektors a’ eines Repräsentanten r lässt sich unter Ausnutzung der beding- 


formal beschreiben als das Produkt 
phar | ER, 9ı:x-ı) =|] p(ak| Ek dı:x-ı) . (5.11) 
i 


Die konkrete Berechnung der prädizierten Verteilungen für die einzelnen 
Attribute erfolgt in Abhängigkeit der Szenarmodi und Skalenniveaus der 
repräsentierten Qualitäten. Im Allgemeinen werden von der Prädiktion die 
perzeptiven Attribute betroffen sein, nicht aber die semantischen. Für ein 
deduktives Attribut muss die Art und Weise seiner Herleitung individuell 
betrachten werden. Nachfolgend werden Beispiele für die Prädiktion von 
Attributen unterschiedlicher Skalenniveaus gegeben. Die genannten Alte- 
rungsfaktoren entsprechen dabei den Alterungsfaktoren der durch das At- 
tribut repräsentierten Qualität. Die Beispiele für eine Prädikation von no- 
minalen und ordinalen Attributen gehen dabei über die Darstellungen der 
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Informationsverarbeitung in Vorarbeiten zur objektorientierten Umweltmo- 
dellierung hinaus. 


Beispiel 1 (Verhältnisskaliertes Merkmal). Sei a“ ein stetiges Attribut, wel- 
ches ein verhältnisskaliertes Merkmal repräsentiert, und v eine mittelwertfreie, 
normalverteilte Zufallsvariable mit Varianz o2, welche das Rauschen bei der 
Prädiktion des Attributs a® beschreibt. Unter der Annahme, dass dieses Rau- 
schen additiv in die Prädiktion eingeht und die Identität als Systemmodell ver- 
wendet wird, ergibt sich das Modell der Transitionswahrscheinlichkeit als die 
Normalverteilung [Ghe10a] 


p(arlak-ı,&) = Nlak - &_1,%) , (5.12) 


welche durch die Varianz des Rauschens charakterisiert wird. Zur Lösung der 
sich unter Verwendung dieses Modells ergebenden Chapman-Kolmogorov Glei- 
chung (5.10) kann das Kalman-Filter genutzt werden. Unter den oben genann- 
ten Bedingungen lassen sich der Erwartungswert und die Varianz der auf den 
Zeitschritt tg prädizierten Wahrscheinlichkeitsverteilung des Attributs aj, da- 
bei als 


E (ak) 
Var (ak) 


E (aĝ) 4 (5.13) 
Var (ag_,) + o} (5.14) 


auf Basis der Kenngrößen der aktuellen Attributverteilung berechnen. Wird das 
Attribut aj,_, hierbei durch eine Normalverteilung beschrieben, so ergibt sich 
das prädizierte Attribut aj, ebenfalls als normalverteilt und ist durch die bei- 
den berechneten Kenngrößen bereits vollständig spezifiziert. Handelt es sich bei 
der Verteilung von aj,_, hingegen um ein durch eine Gaußmischverteilung be- 
schriebenes Attribut, so muss obige Prädiktion für jede (normalverteilte) Kom- 
ponente der Mischverteilung einzeln durchgeführt werden. Die Gewichte blei- 
ben im Prädiktionsschritt unverändert. Durch die Alterung eines stetigen Attri- 
buts erhöht sich somit die Unsicherheit über seinen Wert, reflektiert durch die 
erhöhte Varianz seiner Verteilung. Der hierfür relevante Parameter, die Varianz 
des Rauschens 0}, ergibt sich in Abhängigkeit eines im Hintergrundwissen für 
die betroffene Qualität modellierten Alterungsfaktors. 
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Fir diskrete Attribute ergibt sich das Transitionsmodell als eine Matrix, 
und die Chapman-Kolmogorov Gleichung (5.10) wird entsprechend durch 
die Multiplikation dieser Matrix mit der als Vektor dargestellten diskreten 
Verteilung des Attributs berechnet. Die Prädiktion entspricht dabei einem 
Schritt in einem Markov-Prozess, dessen Zustände von den möglichen Wer- 
ten des diskreten Attributs dargestellt werden. Ein Systemrauschen kann 
für diskrete Attribute in der Form berücksichtigt werden, dass mit einer 
gewissen Übergangswahrscheinlichkeit p, bei der Prädiktion von einem 
Attributwert auf einen anderen Attributwert gewechselt werden kann. 


Beispiel 2 (Nominales Merkmal). Sei af ein diskretes Attribut für ein nomi- 
nales Merkmal mit den Werten fo, Was On} und einem Alterungsfaktor 
Bq. Dann definiert 


T 
xt i= [pl <a), plat <a)... p(a*=a,)} 619) 


den Zustandsvektor für das diskrete Attribut im Zeitschritt tg. Das Systemrau- 
schen wird über die Wechselwahrscheinlichkeit p, spezifiziert. Für nominale 
Merkmale wird dabei aufgrund der fehlenden Ordnungsrelation jeder Wech- 
sel als gleich wahrscheinlich angenommen. Unter dieser Voraussetzung ergibt 
sich die Wechselwahrscheinlichkeit aus dem Alterungsfaktor By als p, : =(1 — 
Ba)/(na — 1). Die zeitliche Fortschreibung des nominalen Attributs af auf den 
Zeitschritt tg ergibt sich dann als das Produkt 


Pi Di su su Di 
Py Ba Py -- D 
— Doo Ns : I. ya 
me: a N (5.16) 
Py = Py Ba Pv 
Py ce + Dr Ba 


N 
Ng X Ng Transitionsmatrix 


der auf Bq und p, basierenden Transitionsmatrix mit dem bisherigen Zustands- 
vektor x _ 
Spaltensummen ergeben sich aufgrund der für p, gewählten Definition als 
Ba + (na — 1); Py = Ba + (1 — fa) = 1. Dies bewirkt, dass mit x} wieder eine 


gültige, normierte Wahrscheinlichkeitsverteilung für af entsteht. 


ı: Die Transitionsmatrix ist dabei symmetrisch. Ihre Zeilen- und 
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Beispiel 3 (Ordinales Merkmal). Sei @ ein diskretes Attribut für ein ordina- 
les Merkmal mit Zustandsvektor X“ analog zu (5.15) und Alterungsfaktor ba. 
Für ordinale Merkmale kann die zugrunde liegende Ordnungsrelation bei der 
Festlegung der Wahrscheinlichkeit eines Attributwert-Wechsels genutzt wer- 
den. Wird beispielsweise angenommen, dass der Wechsel eines Attributwerts 
immer nur zu einem nach der Ordnungsrelation benachbarten Attributwert 
möglich ist, so ergibt sich P, :=(1 — ß.)/ 2 als Basiswert der Wechselwahr- 
scheinlichkeit. Dieser Basiswert wird in der Transitionsmatrix benachbarten 
Attributwerten zugeordnet, so dass sich für diese eine Bandstruktur mit zwei 
Nebendiagonalen ergibt. Eine Sonderstellung nehmen dabei der erste und letzte 
Attributwert in zl ein, für welche nur ein benachbarter Wert existiert. Für die- 
se kann als eine Art Randbedingung die Annahme getroffen werden, dass ein 
Verbleib beim aktuellen Attributwert entsprechend wahrscheinlicher ist, also 
z. B. der Wert Bh : = (Ba + py) genutzt werden, um in der Transitionsmatrix 
wieder Zeilen- und Spaltensummen mit Wert 1 zu erhalten. Unter diesen An- 
nahmen ergibt sich die zeitliche Fortschreibung eines ordinalen Attributs auf 
den Zeitschritt tg dann analog zum Vorgehen bei nominalen Attributen als das 
Produkt 


Ba py 0 0 
By fa By O mo m 0 
. 09 A506. 0 . 
se u. Re ee, (5.17) 
O ao © By Ba By 0 
O a mm 0 Pe fa D 
O ae cae 0 By. Ba 


N 
Na X Na Transitionsmatrix 


. ope . . . „a 
aus einer Transitionsmatrix und dem bisherigen Zustandsvektor X,_,- 
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5.1.4 Beobachtungsmodell 


Die im Zeitschritt tg an das objektorientierte Umweltmodell gelieferte Be- 
obachtung y; kann aus einzelnen Messungen i fiir die beobachteten Quali- 
täten einer Entität bestehen. Messungen enthalten dabei Messwerte zusam- 
men mit einer Unsicherheitsangabe für die Messung. Für jede Qualität wird 
nun ein Messmodell benötigt, welches den Zusammenhang zwischen dem 
Wert einer Qualität und dem entsprechenden Messwert als eine mathema- 
tische Abbildung beschreibt. Bei der Beobachtung von Entitäten wird in der 
objektorientierten Umweltmodellierung allgemein von einer direkten Beob- 
achtbarkeit der zu erfassenden Merkmale ausgegangen. Somit wird i. A. die 
Identitätsfunktion als Messabbildung genutzt. 


Für einen Repräsentanten r beschreibt das Beobachtungsmodell die Wahr- 
scheinlichkeitsverteilung, unter welcher in einer Beobachtung der repräsen- 
tierten Entität bei gegebenen Messunsicherheiten entsprechende Merkmals- 
werte beobachtet werden können. Das Beobachtungsmodell eines Repräsen- 
tanten ergibt sich im Zeitschritt tg als das Produkt [Ghe10a, Bau10] 


n ; 
P(Ie| az, Be) = I] p( ve | a, Ek) (5.18) 
i=l 


aus attributsabhängigen Messmodellen, die durch die individuellen Mess- 
modelle p;(Jx|ax) der Attribute ai des Repräsentanten beschrieben werden 
können. Die Zuordnung eines die Qualität i repräsentierenden Attributs ai 
zur Messung pi der entsprechenden Qualität erfolgt dabei über den Index 
ji. Die konkrete Form der individuellen Messmodelle p;(Jx|ax) hängt vom 
Skalenniveau der durch ai, repräsentierten Qualität ab. Nachfolgend wer- 
den zu unterschiedlichen Skalenniveaus wiederum Beispiele für Messmo- 
delle genannt. Die Darstellung für nominale und ordinale Attribute geht da- 
bei, ähnlich wie in den zuvor genannten Beispielen für Transitionsmodelle, 
über die in Vorarbeiten zur objektorientierten Umweltmodellierung darge- 
stellten Informationen hinaus. 
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Beispiel 4 (Verhältnisskaliertes Merkmal). Sei a“ ein stetiges Attribut, wel- 
ches ein verhältnisskaliertes Merkmal beschreibt. Für das Merkmal wird eine di- 
rekte Beobachtbarkeit angenommen, mit der Identitätsfunktion als Messabbil- 
dung, sowie eine Messunsicherheit, welche in Form eines additiven mittelwert- 
freien Gauß’sches Rauschens y, mit Varianz OP beschrieben werden kann. 


y 
Dann ergibt sich im Zeitschritt tg das Messmodell 


Yk = Ak + Yk, (5.19) 


wobei das Attribut aj, hier stellvertretend für das dargestellte Merkmal steht, 
sowie der funktionale Zusammenhang 


Plage) = Nk - aR, 7p) (5.20) 
in Analogie zum Transitionsmodell (5.12). 


Beispiel 5 (Nominales Merkmal). Sei af ein diskretes Attribut für ein nomi- 
nales Merkmal mit Werten aus fw, [FOREN On, }- Weiterhin beschreibe og die 
Messabweichung für das durch a@ repräsentierte Merkmal in Form einer pro- 
zentualen Sicherheit, den realen Wert des Merkmals auch tatsächlich zu beob- 
achten. Dann beschreibt p, = (1 — 04)/(na — 1) die Wahrscheinlichkeit, einen 
abweichenden Wert zu beobachten. Auch für nominale Attribute wird grund- 
sätzlich die Identitätsfunktion zur Beschreibung des deterministischen Zusam- 
menhangs zwischen Merkmalswert und Messwert angenommen. Stellt man af 
wie in (5.15) als Zustandsvektor x dar, so ergibt sich im Zeitschritt tg der 


funktionale Zusammenhang 


Og Py as Py 
Py 9a Py Py 
a — oOo oo a S : |. xa 
I. = 5 A 2 $ ; Xk (5.21) 
Py Py a Py 
Py Py 7a 


:= H, Mg Xna Messmatrix 


zwischen dem Wahrscheinlichkeitsvektor y% der Messwerte für das Merkmal 


zu at als Produkt aus Messmatrix H und aktuellem Zustandsvektor x: 
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Beispiel 6 (Ordinales Merkmal). Für ein diskretes Attribut mit ordinalem 
Merkmal besitzt das Messmodell die gleiche Form wie (5.21), allerdings ist die 
Messmatrix H als eine Bandmatrix strukturiert (analog zur Matrix in (5.17)). 
Dabei nehmen die beiden Nebendiagonalen den Wert py = (1 — 04)/ 2 an, wel- 
cher auch als zusätzlicher Summand in den beiden Randelementen der Haupt- 
diagonalen auftritt. 


Als Erweiterung des Messmodells (5.18) eines Repräsentanten kann die Mög- 
lichkeit berücksichtigt werden, dass sich bei einer konkreten Beobachtung 
verschiedene Untermengen Mpg © {1,2, ..., n} von enthaltenen Merkma- 
len i ergeben, z.B. in Abhängigkeit des Typs c” der beobachteten Entität 
[Ghe10a, Bau10]. Dies liegt darin begründet, dass zu verschiedenen Entitä- 
ten nicht in allen Situationen für die grundsätzlich beobachtbaren Merkma- 
le auch tatsächliche Werte bestimmt werden können. Davon kann z.B. die 
Form eines Gegenstands betroffen sein, wenn dieser teilweise verdeckt oder 
zu weit entfernt ist. Unter Inbetrachtnahme dieser Möglichkeit erweitert sich 
das Beobachtungsmodell [Ghe10a, Bau10] auf 


Ss u 
P( Ix | a, EL) = Tle(# |a, Et) - P(Mxlck) » Mix = Uji, 
j=1 
(5.22) 


wobei i; hier nun das zur Messung korrespondierende Attribut indiziert. 


Nachfolgend wird beschrieben, wie die Informationsalterung sowie die Ak- 
tualisierungen von Repräsentanten aufgrund neuer Beobachtungen in Form 
einer rekursiven Zustandsschätzung durchgeführt werden können. Die In- 
formationsalterung erfolgt dabei im Sinne einer Prädiktion unter Verwen- 
dung der Transitionsmodelle. Die Aktualisierung erfolgt im Sinne einer Fil- 
terung unter Verwendung der Messmodelle. 
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5.2 Datenassoziation 


Die Datenassoziation löst das Problem der Zuordnung von Entitätsbeobach- 
tungen zu Repräsentanten im Weltmodell und ist somit ein integraler Be- 
standteil der probabilistischen Informationsverarbeitung im objektorientier- 
ten Umweltmodell. Aufgrund der Komplexität des Themas wird die Daten- 
assoziation in einem eigenen Abschnitt beschrieben. 


Mögliche Ansätze Als Ergebnis der Datenassoziation kann entweder eine 
deterministische Zuordnung jeder Beobachtung eines Zeitschritts zu genau 
einem Repräsentanten erfolgen, oder eine probabilistische Zuordnung, 
in welcher die Beziehung zwischen Beobachtungen und Repräsentanten 
in Form einer gemeinsamen Wahrscheinlichkeitsverteilung beschrieben 
wird. Erfolgt eine deterministische Zuordnung, so kann auf Basis dieser 
Zuordnung jeder Repräsentant anschließend unabhängig durch die ihm zu- 
geordneten Beobachtungen aktualisiert werden. Gängige Methoden [Rus10] 
zur Erstellung einer deterministischen Zuordnung sind Nächste-Nachbar- 
Verfahren oder der Kuhn-Munkres-Algorithmus, auch bekannt als die 
Ungarische Methode [Kuh55]. Für eine probabilistische Zuordnung lassen 
sich unterschiedlich komplexe Ansätze und Verfahren mit verschiedenen 
Annahmen unterscheiden. Eine einfachere probabilistische Zuordnung 
erlaubt zunächst die Möglichkeit, einem Repräsentanten nicht nur eine 
Beobachtung zuzuordnen, sondern mehrere Beobachtungen anteilig. Für 
die Aktualisierung des Repräsentanten werden dann alle zugeordneten 
Beobachtungen entsprechend ihres Anteils verwendet. Dieses Vorgehen 
entspricht dem Ansatz des probabilistischen Datenassoziations-Filters 
PDAF! [Bar09]. Ein Problem kann bei diesem Ansatz auftreten, wenn eine 
Beobachtung mehreren Repräsentanten zugleich zugeordnet wird, ohne 
dass diese Mehrfachzuordnung entsprechend berücksichtigt wird. Zur 
Lösung dieses Problems kann der Ansatz des gemeinsamen probabilis- 
tischen Datenassoziations-Filters JPDAF’ [Bar09] genutzt werden. Unter 


* Englisch: Probabilistic Data Association Filter (PDAF) 
* Englisch: Joint Probabilistic Data Association Filter (JPDAF) 
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Anwendung dieses Ansatzes wird dann zusätzlich darauf geachtet, dass für 
Beobachtungen, die mehreren Repräsentanten anteilig zugeordnet werden, 
ihr Gesamtanteil in Summe den Wert 1 nicht überschreitet. Ein weiteres 
Vorgehen stellt ein sog. Multi-Hypothesen-Ansatz dar, in welchem ver- 
schiedene mögliche Zuordnungen von Beobachtungen zu Repräsentanten 
über mehrere Zeitschritte hinweg verfolgt werden, um im Nachhinein und 
mit mehr Informationen die beste Zuordnung auswählen zu können. 


Vorgehen im objektorientierten Umweltmodell Erfolgt eine deterministi- 
sche Zuordnung von Beobachtungen zu Repräsentanten im Weltmodell, so 
kann die Datenassoziation als eigenständiger Verarbeitungsschritt vor der 
Aktualisierung von Repräsentanten ausgeführt werden, wie im allgemeinen 
Verarbeitungsschema dargestellt. Erfolgt dagegen eine probabilistische Zu- 
ordnung, so kann es notwendig bzw. sinnvoll sein, einen integrierten Ansatz 
zu verwenden, in welchem die Assoziation und Aktualisierung von Reprä- 
sentanten, ggf. sogar schon die Prädiktion, zusammen in einem Verarbei- 
tungsschritt durchgeführt werden. 


Ein solch integrierter Ansatz für die Datenassoziation im objektorientierten 
Umweltmodell wird in Vorarbeiten von Baum et al. [Bau10] beschrieben. 
Dabei wird davon ausgegangen, dass ein kognitives System mittels Senso- 
ren eine Szene beobachtet und dabei pro diskretem Zeitschritt genau die 
Merkmale einer Entität erfasst und als Beobachtung an das Weltmodell ge- 
liefert werden. Das Problem der Datenassoziation besteht nun daraus, die 
gelieferten Messergebnisse einem Repräsentanten im Weltmodell zuzuord- 
nen. Das in [Bau10] vorgeschlagene Vorgehen für das objektorientierte Um- 
weltmodell entspricht dabei dem Ansatz des gemeinsamen probabilistischen 
Datenassoziations-Filters JPDAF mit der zusätzlichen Einschränkung, dass 
pro Zeitschritt nur eine Beobachtung vorliegt. Das Weltmodell wird für die 
Datenassoziation als die Menge R der in ihm enthaltenen Repräsentanten 
aufgefasst werden. Sind zum Zeitpunkt der Beobachtung |R| Repräsentan- 
ten im Weltmodell enthalten, so muss zur Lösung des Datenassoziations- 
problems eine diskrete Zufallsvariable d über allen Repräsentanten aus R 
bestimmt werden. Jedem r € R wird dabei die Wahrscheinlichkeit p(d = r) 
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zugeordnet, dass durch die Beobachtung die vom Repräsentanten darstell- 
te Entität erfasst wurde, vorausgesetzt der Repräsentant existiert zu diesem 
Zeitpunkt (dargestellt als das Ereignis e” = 1). 


Struktur des Abschnitts Nachfolgend wird das grundlegende Vorgehen 
zur Datenassoziation im objektorientierten Umweltmodell aus Vorarbeiten 
vorgestellt. In Abschnitt 5.2.1 wird dabei auf die Aktualisierung von deskrip- 
tiven Attributen eingegangen. In Abschnitt 5.2.2 wird die Berechnung der 
Zuordnungswahrscheinlichkeit beschrieben, welche gemeinsam mit der Ak- 
tualisierung der Existenzwahrscheinlichkeiten der Repräsentanten erfolgt. 
Anschließend werden in den nachfolgenden drei Abschnitten verschiede- 
ne eigene Erweiterungen dieser probabilistischen Datenassoziation für die 
objektorientierte Umweltmodellierung vorgeschlagen (5.2.3,5.2.4) und de- 
monstriert (5.2.5), basierend auf einer Untersuchung des bisherigen Vorge- 
hens (5.2.3). 


5.2.1 Zustandsschätzung zur Beobachtungsintegration 


Wenn in einem Zeitschritt tg eine neue Beobachtung f, an das Weltmo- 
dell geliefert wird, wird das allgemeine Prädiktor-Korrektor Schema der 
Bayes’schen Zustandsschätzung zur Aktualisierung der gespeicherten Re- 
präsentanten genutzt. Dazu werden zunächst in einem Prädiktionsschritt 
die Existenzwahrscheinlichkeiten aller Repräsentanten auf den Zeitschritt 
tp zeitlich fortgeschrieben, wie in Gleichung (5.8) beschrieben. Gleichzeitig 
werden die Attributverteilungen der Repräsentanten zeitlich fortgeschrie- 
ben, unter der Annahme, dass der entsprechende Repräsentant weiterhin 
im Weltmodell existiert, ansonsten unabhängig vom konkreten Wert der 
Existenzwahrscheinlichkeit. Dazu wird Gleichung (5.10) verwendet. 


Aktualisierung von deskriptiven Attributen 
Nach dem Prädiktionsschritt folgt der Filterschritt, in welchem auch die As- 


soziation der Beobachtung mit den entsprechenden Repräsentanten erfolgt 
[Bau10]. Zur Berechnung der aktualisierten Verteilung p(al|EL, yı: k) eines 
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deskriptiven Attributs a‘, des Repräsentanten r wird der Filterschritt 


p(arlEk,Jı:k) = J, PlaklEk- Paste dk) © P(drlEk, Drs) (5.23) 
dk 


durchgeführt. Der Aktualisierungsterm p(ai EL, Disks dp) wird dabei mit 
dem Faktor p(dk EL J1:k) gewichtet [Bau10]. Dieser gibt die Wahrschein- 
lichkeitsverteilung für die Assoziation der Beobachtung p zu den Reprä- 
sentanten r € R an, basierend auf der Historie der bisherigen Beobach- 
tungen j,.,. Für den Fall D; := (dy = r), dass die Beobachtung zum be- 
trachteten Repräsentanten r korrespondiert, kann der Aktualisierungsterm 
als die übliche A-posteriori-Verteilung der Bayes’schen Zustandsschätzung 
berechnet werden als 


Er 1 his ; N 
p(atlE-9ı:c DE) = E- p9h ak BE. DE) - pC@RIEL. Drie» DE) - 
~ ee 
Likelihood A-priori-Verteilung 
(5.24) 


Hierbei stellt z eine Normierungskonstante dar. Weiterhin können, unter 
der gegebenen Bedingung Dj, als Likelihood das Messmodell p;(Jx|ax) des 
betrachteten Attributs af genutzt werden sowie als a-priori Verteilung das 
Ergebnis des Prädiktionsschritt (5.10). Je nach Skalenniveau des Attributs 
ai ist hierbei ein unterschiedliches Vorgehen notwendig. Dies wird nach- 
folgend als kurzer Einschub anhand von zwei Beispielen dargestellt, bevor 
auf den Fall Di := (dk # r) eingegangen wird. 


Beispiel 7 (Stetiges Attribut). Sei a“ ein stetiges Attribut mit Messmodell 
(5.20). Ist a° normalverteilt, so kann zur Berechnung der aktualisierten At- 
tributverteilung das wohlbekannte Kalman-Filter eingesetzt werden. Wird a“ 
hingegen durch eine Gaußmischverteilung beschrieben, so muss zunächst jede 
(normalverteilte) Komponente einzeln aktualisiert werden, und anschließend 
eine Aktualisierung der Gewichte durchgeführt werden. 


Beispiel 8 (Diskretes Attribut). Sei af ein diskretes Attribut mit Werten aus 
fo, (OP Ona} und x der entsprechende Zustandsvektor für af anhand 
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4 sowie dessen Sicher- 


von (5.15). Sei weiterhin ein Messwert fẹ = w; für a 
heit og in einer Beobachtung gegeben und H die dem Skalenniveau des durch 
af repräsentierten Merkmals entsprechende Messmatrix (wie z. B. in (5.21) für 
nominale Merkmale definiert). Zur Aktualisierung des Attributs werden dann 
all diejenigen Beobachtungswahrscheinlichkeiten p(k = @;|a®) zum gegebe- 
nen Messwert œw; aus H ausgewählt (hier notiert als Hý, -,) und als Diago- 
nalmatrix dargestellt. Für das aktualisierte Attribute ä@ ergibt sich dann die 
Wahrscheinlichkeitsverteilung 


~a . 
x? = Diag (Hiy,=0,) - x2 (5.25) 


als Produkt dieser Diagonalmatrix mit dem Zustandsvektor x. 


Neben Dy := (dp = r) muss bei der Aktualisierung von deskriptiven At- 
tributen in (5.23) auch der Fall betrachtet werden, dass die Beobachtung 
Yx nicht dem betrachteten Repräsentanten r zugeordnet ist. Für alle Fälle 
Dy := (dx # r) hat die Beobachtung f, dabei keinen Einfluss auf die Attri- 
bute a) von r. Nach Vermaak et al. [Ver05], auf welche sich [Bau10] bezieht, 
kann in diesem Fall die entsprechende Likelihood pka}, Dj) als propor- 
tional zu 1 angenommen werden. Damit ergibt sich als Aktualisierungsterm 
direkt die unveränderte A-priori-Verteilung 


p(aklEk Si: Dk) = p(aklEk Pı:k-1) - (5.26) 
Der Filterschritt für deskriptive Attribute (5.23) kann somit als die Summe 
1 adil i i z A 
= pl ak, Ek. DE) - PlaklEk. 91:k-1 DE) > P(DEIER 91:x) 
+ p(a}|Ek Îi:k-1» Dg) + p(Dy Ee J1:k) 
(5.27) 


beschrieben werden, unter Angabe aller formal benötigter Bedingungen. 


192 


5.2 Datenassoziation 


Zusammengefasst und vereinfacht dargestellt ergibt sich der Filterschritt zur 
Aktualisierung eines deskriptiven Attributs ai, somit als 


p (a | EK D1:k) = 


i à 1 r ajili r 
p (ap|Ek D141) (3 -pë p(x! |aj Ek. DL) + (1 =p; ) » (5.28) 
™— aami N mammie 


A-priori-Verteilung Likelihood 


mit der Abkürzung pe := p(DX|EX, Jı:k). Anschaulich gesprochen bedeu- 
tet dies, dass eine gegebene Beobachtung f, je nach Verteilung der Asso- 
ziationswahrscheinlichkeit p(d,|ex, 91: k) anteilig zur Aktualisierung von 
unterschiedlichen Repräsentanten beitragen kann - nämlich allen Reprä- 
sentanten r mit D(Dy leks 91:k) # 0. Dies entspricht somit, wie bereits ein- 
leitend erwähnt, dem grundsätzlichen Vorgehen des gemeinsamen probabi- 
listischen Datenassoziations-Filters JPDAF für den Spezialfall, dass jeweils 
nur ein Objekt pro Zeitschritt beobachtet wird. Alle anderen Repräsentanten 
im Weltmodell werden nicht aktualisiert, unabhängig davon jedoch zeitlich 
fortgeschrieben. 


5.2.2 Assoziation- und Existenzwahrscheinlichkeit 


Die Berechnung der Assoziationswahrscheinlichkeit pt in (5.28) erfolgt 
in einem Schritt mit der Aktualisierung der Existenzwahrscheinlichkeiten 
p(exr|Jı:x) [Bau10]. Dazu wird die gemeinsame Verteilung von Existenz- 
und Assoziationswahrscheinlichkeiten p(exr, de|Jı: k) genutzt. Für einen 
Repräsentanten r kann dessen Existenzwahrscheinlichkeit dabei durch 
Marginalisierung der gemeinsamen Verteilung über die Existenzvariablen 
der restlichen Repräsentanten und die Assoziationsvariable berechnet 


: r r FIR 
‘Mite, := ler , ep,- ep! Ir 
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werden als 


Il 


3 Plek, del Jı:k) > 


rita hia fin ‚Mel 
Cp Cpr sO beet iek 


plez, dy| Pa:k) 


(5.29) 


> pler, de| Ir:k) - (5.30) 
dk 


P(e! | Drs) 


Die Assoziationswahrscheinlichkeit eines Reprasentanten r ergibt sich auf 
Basis der marginalisierten Verteilungen als die bedingte Wahrscheinlichkeit 


; EL, DE |9: 
pi _ p( k : lasek) (5.31) 
P (Ekli) 


Aktualisierung von Existenz- und Assoziationswahrscheinlichkeit 


Der für das objektorientierte Umweltmodell vorgeschlagene Ansatz zur Da- 
tenassoziation [Bau10] wird als Spezialfall des Vorgehens von Horridge und 
Maskell [Hor09] sowie Vermaak et al. [Ver05] ausgewiesen, in welchem die 
gleichzeitige Verfolgung mehrerer Objekte basierend auf einer Menge von 
Sensormessungen pro Zeitschritt betrachtet wird. Ziel ist dabei, jedem Ob- 
jekt die von ihm erzeugte Messung zuzuordnen, falls dieses im betrachteten 
Zeitschritt beobachtet wurde. Dazu wird je Objekt eine Assoziationsvaria- 
ble über der Menge der Sensormessungen pro Zeitschritt eingeführt. Bei der 
Datenassoziation im OOWM liegen geänderte Bedingungen vor. Der haupt- 
sächliche Unterschied besteht darin, dass pro Zeitschritt nur die Beobach- 
tung einer einzelnen Entität betrachtet wird. Das Problem der Datenassozia- 
tion besteht nun darin, diese Beobachtung einem Repräsentanten im Welt- 
modell zuzuordnen. Für die objektorientierte Umweltmodellierung wurden 
in [Bau10] Assoziationsvariablen dx eingeführt, welche im Unterschied zum 
Vorgehen in [Hor09] bzw. [Ver05] aber nun über der Menge der Repräsen- 
tanten definiert sind. Dieser grundlegende Unterschied muss in den nach- 
folgenden Ausführungen in Betracht gezogen werden. 
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Die gemeinsame Verteilung von Existenz- und Assoziationswahrscheinlich- 
keiten für den Zeitschritt tg ergibt sich anhand des Satzes von Bayes als das 
Produkt [Bau10, Hor09] 


A 1 i R 5 
Pler delfi) = > + Prle di Pi:k-1) © Plew UelVr:k—1) (5-32) 
2 z = = = 
Prädizierte Messung Priore Verteilung 


einer Prädiktion der Messung und der prioren Existenz- und Assozia- 
tionswahrscheinlichkeit, mit Normierungskonstante z,. Die prädizierte 
Messung beschreibt dabei die erwartete Verteilung der Messung bzw. die 
Wahrscheinlichkeit einer konkreten Messung f}, ausgehend von einer ge- 
gebenen Zuordnung Dy der Messung zu einem als existent angenommenen 
Repräsentanten r und dessen auf den aktuellen Zeitschritt tg prädizier- 
ten Zustand. Die Berechnung der prädizierten Messverteilung erfolgt als 
Chapman-Kolmogorov Integral durch die Einführung des Zustands des 
betroffenen Repräsentanten r [Hor09]. Für dg = r ergibt sich somit 


P(Dicleks Dk Sı:r-ı) = J ode Ex, Dy) - p(az |E% Jı:x-1) dal , 
m mn N mn nn nn 


Messmodell für r Prädizierter Zustand 


(5.33) 


für den Fall, dass der betroffene Repräsentant auch existiert, also das Ereig- 
nis Ex als eine Komponente im Vektor e, enthalten ist. Ein solcher Vektor 
wird nachfolgenden abkürzend als e% notiert. Nichtexistierende Repräsen- 
tanten im Falle der Parameterkombination Dy und Ex tragen nach [Ver05] 
und [Hor09] nicht zur Messverteilung bei, so dass 


POxl&, Di dı:k-ı) = 0, (5.34) 


wobei der Vektor &, hier abkürzend den Fall beschreibt, dass explizit das 
Ereignis Ey im Vektor e, beschrieben ist. 
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Die priore Existenz- und Assoziationswahrscheinlichkeit kann als das Pro- 
dukt [Bau10] 


Plek, Aklyı:k-ı) = PCAkleks Jı:k-ı) + PlerlJı:r-ı) (5.35) 
= = = 
Priore Assoziation Präd. Existenz 


aus prädizierten Existenzwahrscheinlichkeiten und einer Verteilung der 
prioren Assoziationswahrscheinlichkeiten berechnet werden. 


Priore Assoziationswahrscheinlichkeit 


Für diese priore Assoziationsverteilung können nun verschiedene Model- 
le angenommen werden. Nach Horridge und Maskell [Hor09] werden bei- 
spielsweise existierende Objekte (ex = 1) mit einer gewissen Wahrschein- 
lichkeit durch Messungen detektiert. Nichtexistierende Objekte (ex = 0) 
werden dagegen mit Wahrscheinlichkeit 1 nicht detektiert, also mit kei- 
ner Messung assoziiert. Die Assoziationsvariablen pro Objekt ergeben sich 
in Abhängigkeit von der Objektexistenz dann entsprechend dieses Modells. 
Für die objektorientierte Umweltmodellierung wird in [Bau10] ein ähnliches 
Modell vorgeschlagen, welches die Existenzvariable ey eines einzelnen Re- 
präsentanten r mit der Wahrscheinlichkeit der Belegung der Assoziationsva- 
riable dg = r in Verbindung setzt, und dabei das skalare Transitionsmodell 


p(DklEX) = Pr (5.36) 
p(DElEX) = Pr (5.37) 


nutzt, welches die Beobachtung einer existierenden Entität („Treffer“) durch 
die Wahrscheinlichkeit pr modelliert. Dabei ist die Wahrscheinlichkeit einer 
falschen Zuordnung, d.h. die Zuordnung einer Beobachtung zu einer nicht- 
existierenden Entität, explizit mit einer Wahrscheinlichkeit pr modelliert. 
Da im objektorientierten Umweltmodell die Assoziationsvariable über der 
Menge der Repräsentanten definiert ist, muss das skalare Modell p(d;Je;.) 
auf ein vektorwertiges Modell p (d;|ex) erweitert werden, um in Gleichung 
(5.35) genutzt werden zu können. Dabei ist zu beachten, dass im objektori- 
entierten Umweltmodell das Ereignis dg # r; gleichbedeutend dazu ist, dass 
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p(q = rj) > 0 für mindestens einen anderen Repräsentanten rj mit j # i 
gelten muss. 


5.2.3 Erweiterung und Untersuchung der 
Datenassoziation 


Ein vektorwertiges Modell p(d;.|ex) für die priore Assoziationswahrschein- 
lichkeit wird in Vorarbeiten zur objektorientierten Umweltmodellierung 
nicht diskutiert. Nachfolgend werden daher zwei eigene mögliche Ansätze 
für solche Modelle vorgestellt, die im Rahmen dieser Arbeit entwickelt 
wurden. Unter Verwendung dieser Modelle wird daraufhin der bisher vor- 
gestellte Ansatz zur Datenassoziation im objektorientierten Umweltmodell 
detailliert untersucht. 


Zunächst muss für vektorwertige Modelle beachten werden, dass nach (5.34) 
prädizierte Messungen nur dann nicht verschwinden, wenn der aufgrund 
der Assoziation Dj durch die Messung betroffene Repräsentant r auch exis- 
tiert, also ej gilt (Ej ist in e, gegeben). Dies bedeutet im Speziellen, dass 
die Werte von bedingten Wahrscheinlichkeiten der Form p(Dj jer) in jedem 
vektorwertigen Modell keine Relevanz bei der Berechnung der gemeinsa- 
men posterioren Existenz- und Assoziationswahrscheinlichkeit haben (we- 
gen Auslöschung) und somit ignoriert werden können. 


Ein erstes einfaches Modell für p(d,|e,) ergibt sich unter diesen Vorausset- 
zungen, indem man analog zum Vorgehen in [Hor09] bei der prioren Asso- 
ziation keine nichtexistierenden Entitäten berücksichtigt, als 


pole) := pr, pOileji= 0. (5.38) 


Dieses Modell beschreibt, dass jede in einem Zeitschritt existierende En- 
tität mit der gleichen Wahrscheinlichkeit pr beobachtet werden kann. 
Als nichtexistiert angenommene Entitäten können nicht beobachtet wer- 
den. Die Wahrscheinlichkeit pr ergibt sich dabei aus der Anzahl der 
im Zeitschritt existierenden Repräsentanten. Ein zweites, komplexeres 
Modell für die priore Assoziationswahrscheinlichkeit kann dagegen die 
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Existenzwahrscheinlichkeiten e, aller Repräsentanten für die Assoziation 
berücksichtigen. Dies kann erreicht werden, indem Fehldetektionen im Falle 
von E; dadurch berücksichtigt, dass mit einer bedingten Wahrscheinlichkeit 
PF := p(pzler = 1,EL) für als existent angenommene Repräsentanten 
r; # r die Beobachtung dem Repräsentanten r zugeordnet wird, obwohl 
eigentlich der Repräsentant r; beobachtet wurde (genauer gesagt, die durch 
ihn repräsentierte Entität). Dieses Modell beschreibt also nun, dass wenn 
eine Entität existiert, diese mit einer Wahrscheinlichkeit größer als pr 
beobachtet werden kann (und sonst weiterhin nicht). Beschreibt epi im 
obigen Sinne das Ereignis 


f Fiz ri fi F j3 
gf = ler. a ae, Ber e" | f (5.39) 


ry 
so kann unter Nutzung der Iverson Notation’ [E,’] als Modell dieser kom- 
plexeren prioren Assoziation die 1 x |R|-Transitionsmatrix 


[Ex] ‘Pr. [Ey] + Pr» --- [EL] pr; Pr [EX] pr, -. 2] - pr] 
es eee 
=: pldx=rile,') 

(5.40) 


angegeben werden. Unter Verwendung dieses Modells kann nun die Be- 
rechnung der gemeinsamen Existenz- und Assoziationswahrscheinlichkeit 
in (5.32) konkretisiert werden. Für den Fall e}! ergibt sich diese gemeinsa- 
me Wahrscheinlichkeit durch Multiplikation obiger Transitionsmatrix mit 
dem Vektor [p(E;" dı:r-1)» P(Er |Pa:k-1)> er Ro Pre] der pradi- 
zierten Existenzwahrscheinlichkeiten E als 


p(er Dy Darke) ~ 


Bet (or p(Ek' Pir) + % [Er] Pr P(E Pr) » (541) 


V GAT; 


1 Für eine Aussage S wird der Ausdruck |S | dabei zu 1 ausgewertet, falls die Aussage wahr ist, 
anderenfalls zu 0. 
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wobei pÈ i= P(x |E,',D;,') abkürzend die Wahrscheinlichkeit der Beob- 
achtung f, im prädizierten Messmodell von r; beschreibt. Anderenfalls gilt: 


P(e, Dila) = 0. (5.42) 
Eigenschaften der gemeinsamen Wahrscheinlichkeitsverteilung 


Wie oben erwähnt wird für das objektorientierte Umweltmodell in Vorar- 
beiten [Bau10] angenommen, dass pro Zeitschritt immer nur maximal die 
Beobachtung einer Entität verarbeitet wird - im Gegensatz zur Erfassung 
aller relevanten Objekte pro Zeitschritt im Ansatz von Horridge und Mas- 
kell [Hor09]. Weiterhin aktualisiert der bisher vorgestellte Ansatz zur Da- 
tenassoziation ähnlich wie das ursprüngliche Verfahren [Hor09] Existenz- 
und Assoziationswahrscheinlichkeiten über eine gemeinsame Verteilung. In 
Kombination ergeben sich aus diesem Vorgehen einige Eigenschaften, die 
nachfolgend genauer betrachtet werden sollen. 


Ein Nachteil ist mit der Annahme verbunden, dass pro Zeitschritt immer nur 
eine Entität beobachtet wird. Aus dieser Annahme resultiert, unter Verwen- 
dung des Verarbeitungsschemas mit Prädiktion und Aktualisierung in jedem 
Schritt, dass die Existenzwahrscheinlichkeit der Repräsentanten aller nicht 
beobachteten Entitäten in jedem Zeitschritt abnimmt. Dies gilt unabhängig 
davon, ob diese in der beobachteten Umgebung tatsächlich weiterhin vor- 
handen sind oder nicht. Für eine qualitative Betrachtung dieses Umstands 
und seiner Auswirkungen wurden einfache Simulationen durchgeführt. Da- 
bei wurden die beiden in dieser Arbeit vorgeschlagenen Modelle einer vek- 
torwertigen prioren Assoziationswahrscheinlichkeit in Ergänzung des bis- 
herigen Ansatzes [Bau10] verwendet. In diesen Simulationen sanken die 
Existenzwahrscheinlichkeiten nicht beobachteter Repräsentanten bereits in 
einem Zeitschritt auf Werte im Bereich von nur 50%. Ein Umweltmodell 
wird sich unter diesen Voraussetzungen also sehr schnell unsicher über alle 
Entitäten, die aktuell nicht beobachtet werden. Um dieses Verhalten besser 
verstehen zu können, wurde der oben beschriebene Ansatz zur Datenasso- 
ziation auch quantitativ untersucht, wieder unter Verwendung der beiden 
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vorgeschlagenen Modelle fiir die priore Assoziation. Die Ergebnisse dieser 


Betrachtungen werden nachfolgend dargelegt. 


Unabhangig vom genutzten Modell gilt fiir die gemeinsamen Existenz- und 


Assoziationswahrscheinlichkeiten p(ex, dx |Jı:x): 


« Nach (5.34) nimmt die gemeinsame Wahrscheinlichkeit nur für Para- 


meterkombinationen aus einer Assoziation D,’ (welche als dk = 1; 
definiert ist) und Existenzwahrscheinlichkeiten der Form eri einen 
Wert ungleich 0 an. Dieser Wert wird nachfolgend mit p; bezeichnet: 


p.s p(ex Di Pak): 


Um einfacher interpretierbare Aussagen ableiten zu können, wurde zunächst 


das einfache Modell der prioren Assoziation betrachtet. Dabei gilt: 
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« Im einfachen Modell hat die gemeinsame Verteilung p(er , D; 9: k) 


unter der Annahme, dass der Repiasttiiant r; existiert (Ex') und ihm 
die Beobachtung a wird (D;' '), für alle Belegungen der rest- 
lichen Existenzvariablen e im Vektor ei , mit rj # ri, den gleichen 
Wert, nämlich p;. Für eine feste Zuordnung De tritt dieser Wert in der 
gemeinsamen Verteilung insgesamt 2!*!-! mal auf (für alle möglichen 
Kombinationen der restlichen Existenzvariablen). 


Die Normierungskonstante z, für die Berechnung der gemeinsamen 
Verteilung nach (5.32) ergibt sich als Summe aller von Null verschiede- 
nen Wahrscheinlichkeitswerte der gemeinsamen Verteilung. Für eine 
feste Zuordnung D;' sind dies die 2'*!-! Werte p;. Für alle möglichen 
Zuordnungen dg € {1,2,...,|R|} ergibt sich z, insgesamt dann als 


- IR] 
Ze = rl 1, Xii Pi. 


Die Berechnung der Existenzwahrscheinlichkeit p(E |9: k) eines 
einzelnen Repräsentanten erfolgt durch Marginalisierung anhand 
von (5.29) und (5.30). Hierbei ergeben sich als Summanden neben 
den 2!*|-! Werten p; durch die Summation über d; in (5.30) weitere 
Werte. Für alle Terme mit dg = r;, in denen neben E; auch BE 
in ex gegeben ist, ergibt sich der Summand pj. Der Wert p; kann 
hierbei kombinatorisch tiber alle restlichen Existenzvariablen fir 


2|R|-2 


Repräsentanten É frorj} insgesamt mal auftreten. 


5.2 Datenassoziation 


Basierend auf diesen Uberlegungen ergibt sich die normierte posteriore Exis- 
tenzwahrscheinlichkeit P(E, 91: k) eines Repräsentanten r; somit als 


= IR] = 
u. Ce Caaan) 
p(E; 91:1) = IR. IR] 
2 Dae =1 Pj 
ait? . (p+ Di py) 


2IR]-1 . VB 


(5.43) 


NI =e 
M 
3 


Die Wahrscheinlichkeiten p; haben im einfachen Modell der prioren Asso- 
ziation (5.38) dabei die Form 


Pi ~ pri Pr P(E Dak) > (5.44) 


in welcher p% i die Wahrscheinlichkeit der prädizierten Beobachtung 
darstellt. Der Wert dieser Wahrscheinlichkeit hängt von der konkreten 
Zuordnung d, = r ab. Für Zuordnungen d;, = r;, bei denen die Beobach- 
tung y, in hohem Maß den Attributwerten des Repräsentanten r; ähnelt, 
wird dieser Faktor für r; groß im Gegensatz zu den Faktoren für die rest- 
lichen r; # r;. Dies spiegelt sich auch in p; bzw. den verschiedenen pj; 


wider. Damit a der Term p;/ pe T pj einen Wert nahe 1 an, wodurch 

p(E,' la: k) © sa + 1) insgesamt ebenfalls Werte nahe 1 annimmt. Sind 
Beobachtung und Repräsentant allerdings hinreichend unähnlich (dk # r), 
so verschwindet dieser Term nahezu, und p(Er|9ı:K) N “(1 + 0) ergibt 
sich als Wert nahe 0.5. 


In Konsequenz ergeben sich die folgenden beiden Schlussfolgerungen aus 
obiger Betrachtung: bei Anwendung des einfachen Modells im Aktualisie- 
rungsschritt der Datenassoziation nimmt die Existenzwahrscheinlichkeit 
des aktuell beobachteten Reprasentanten einen Wert nahe 1 an, wobei seine 
priori Existenzwahrscheinlichkeit hierbei nur einen geringen Einfluss hat. 


201 


5 Probabilistische Informationsverwaltung in der Umweltmodellierung 


Weiterhin nehmen die Existenzwahrscheinlichkeiten aller im betrachteten 
Zeitschritt nicht beobachteten Repräsentanten Werte nahe 0.5 an. 


Die gleiche Betrachtung wurde nun erneut unter Verwendung des kom- 
plexeren Modells der prioren Assoziation (5.40) durchgeführt. Auch hier 
ergibt sich für die posteriore Existenzwahrscheinlichkeit eines einzelnen 
Repräsentanten eine zu (5.43) ähnliche Struktur. Zu den Termen p; kommen 
als Wert für die gemeinsame Existenz- und Assoziationswahrscheinlich- 
keit plek, Di lJı:k) allerdings noch weitere Terme hinzu, für alle e = 1 
in e, (mit j # i). Diese Terme hängen von den entsprechenden prioren 
Existenzwahrscheinlichkeiten p(E, \)1:k-1) der Repräsentanten rj ab 
und sind über die Wahrscheinlichkeit pp einer Falschassoziation skaliert. 
Durch die Marginalisierung treten in den posterioren Existenzwahrschein- 
lichkeiten einzelner Repräsentanten weiterhin Terme auf, in denen die 
Wahrscheinlichkeiten p% j prädizierter Beobachtungen anderer Reprä- 
sentanten enthalten sind. Die posterioren Existenzwahrscheinlichkeiten 
hängen somit formal von den prioren Existenzwahrscheinlichkeiten und 
Beobachtungswahrscheinlichkeiten aller r; in R ab. 


Nimmt man vereinfachend gleiche priore Existenzwahrscheinlichkeit für 
alle Repräsentanten an, so ergibt sich mit dem komplexeren Modell der 
prioren Assoziation die normierte posteriore Existenzwahrscheinlichkeit 
P(Eq' P14) als 


Yr; Yr; =l 


1 zt L 
2 14 A Yr; +((1+ Pk m) (+a) 
Dr er Px! Dr jr; Pk j PF 


(5.45) 


R 
Dabei wird die ähnliche Struktur zu (5.43) sichtbar. Der Term p;/ >, Dj ist 
fiir das komplexere Modell durch die normierte pradizierte Beobachtungs- 
wahrscheinlichkeit BC i/ Ur yer Dr j ersetzt und um einen weiteren, posi- 
tiven Summanden ergänzt. In Analogie zum einfachen Modell nimmt dieser 


202 


5.2 Datenassoziation 


Term Werte nahe 1 an, falls die Beobachtung y, in hohem Maß den At- 
tributwerten des Repräsentanten r; ähnelt (d« = r;). Die posteriore Exis- 
tenzwahrscheinlichkeit von r; nimmt dann ebenfalls einen Wert nahe 1 an. 
Für unähnliche Beobachtungen mit dk # r; verschwindet der Term nahezu, 
und der zweite Summand dominiert die Summe. Allerdings nimmt auch die- 
ser im Falle unähnlicher Beobachtungen Werte nahe 0 an, in Abhängigkeit 


vom Verhältnis 27 und der Anzahl an Repräsentanten |R| im Weltmodell. 


Je größer Dr im Verhältnis zu Pr ist, desto größer wird der zweite Sum- 
mand - absolut sind die Werte allerdings immer noch relativ nahe an Null. 
Die Abweichung von Null führt allerdings dazu, dass sich beim komplexe- 
ren Modell der prioren Assoziation posteriore Existenzwahrscheinlichkeiten 
> ; ergeben. In einer Simulation mit 5 Repräsentanten und einem Verhalt- 
nis Pr = 0.4: pr ergeben sich z. B. Werte von 0.55 für Repräsentanten, die 
unähnlich zur Beobachtung sind, wenn die prioren Existenzwahrscheinlich- 
keiten als gleich angenommen werden. 


Zusammenfassend ergeben sich somit unter Verwendung beider Modelle 
der prioren Assoziation ähnliche Ergebnisse für die durchgeführte Unter- 
suchung, nämlich dass: 


e die Existenzwahrscheinlichkeiten pE; pik) von Repräsentanten 
nicht auf Werte > 0.5 abfallen, u 


+ die Existenzwahrscheinlichkeit der in einem Zeitschritt beobachteten 
Entität Werte nahe 1 annimmt, ohne dass ihre priori Existenzwahr- 
scheinlichkeit hierauf großen Einfluss hätte, und 


+ die Existenzwahrscheinlichkeiten der in einem Zeitschritt nicht beob- 
achteten Entitäten sehr schnell auf Werte nahe 0.5 sinken. 


Damit zeigt das bisherige Vorgehen zur Datenassoziation in der objektorien- 
tierten Umweltmodellierung zusammen mit den vorgeschlagenen Modellen 
einige Eigenheiten, die sich nicht notwendigerweise mit der intuitiv erwar- 
teten zeitlichen Entwicklung der Existenzwahrscheinlichkeiten von Reprä- 
sentanten decken. 
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5.2.4 Alternativer Ansatz zur Assoziation 


Als Konsequenz aus den oben genannten Nachteilen wird in dieser Arbeit 
ein alternativer Ansatz zur Berechnung der Existenzwahrscheinlichkei- 
ten umgesetzt. Dieser Ansatz erweitert bzw. modifiziert das bisherige 
Vorgehen zur Datenassoziation [Baul0] in der objektorientierten Um- 
weltmodellierung. Ziel dieser Erweiterung ist es dabei, vor allem die sich 
ergebende zeitliche Entwicklung der Existenzwahrscheinlichkeiten von 
Repräsentanten mehr der intuitiven Erwartung an diese anzupassen, wie 
sie z.B. in anderen Vorarbeiten zum objektorientierten Umweltmodell (z.B. 
[Hei10]) beschrieben wurde. Im Speziellen soll die Berechnung der aktu- 
ellen Existenzwahrscheinlichkeit eines Repräsentanten dabei signifikant 
von seiner prioren Existenzwahrscheinlichkeit abhängen. Weiterhin sollen 
die Existenz-wahrscheinlichkeiten für nicht beobachtete Repräsentanten 
allmählich in Abhängigkeit des definierten Alterungsfaktors abfallen und 
auch Werte kleiner 0.5 annehmen können. 


Dass der bisherige Ansatz zur Datenassoziation ein anderes Verhalten zeigt, 
liegt vor allem in der Annahme von nur einer beobachteten Entität pro Zeit- 
schritt begründet, im Zusammenspiel mit dem Aufsetzen auf einem Ansatz 
[Hor09], in welchem für jedes Objekt eine Beobachtung pro Zeitschritt ange- 
nommen wird. Folglich beschreibt im Ansatz von [Hor09] die Tatsache, dass 
ein Objekt in einem Zeitschritt nicht beobachtet wird, ein Fehlen dieses Ob- 
jekts. Eine derartige Beobachtung soll somit in einer deutlich verringerten 
Existenzwahrscheinlichkeit für dieses Objekt resultieren. Unter der Annah- 
me von nur einer Beobachtung pro Zeit-, und vor allem, pro Verarbeitungs- 
schritt besitzt die Nichtbeobachtung eines Objektes in einem Zeitschritt al- 
lerdings eine stark veränderte Semantik. Die Nichtbeobachtung beschreibt 
hierbei nur die Tatsache, dass das Objekt nicht im Fokus der aktuellen Be- 
obachtung stand, jedoch kein grundsätzliches Fehlen des Objekts. Denn das 
Objekt kann jederzeit im Fokus einer der nächsten Beobachtungen stehen, 
ohne jemals gefehlt zu haben. Allein die Nichtbeobachtung eines Objektes 
über einen längeren Zeithorizont hinweg stellt einen Indikator für dessen 
Fehlen dar. Dieser grundsätzliche Unterschied zwischen den Annahmen für 
die objektorientierte Umweltmodellierung und dem Ansatz in [Hor09] soll 
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in dieser Arbeit nun durch Anpassung der bisherigen Datenassoziation Be- 
achtung finden. 


Dazu muss zunächst die gemeinsame Berechnung der Existenz- und Asso- 
ziationswahrscheinlichkeiten in Gleichung (5.32) betrachtet werden. Diese 
stellt die Grundlage für die Berechnung sowohl der Assoziationsverteilung 
über alle Repräsentanten als auch der Existenzwahrscheinlichkeit der ein- 
zelnen Repräsentanten dar. Über den Faktor der prädizierten Messungen 
werden in dieser Gleichung die Existenzwahrscheinlichkeiten aller derjeni- 
gen Repräsentanten abgewichtet, die nicht hinreichend ähnlich zur betrach- 
teten Beobachtung sind. Dieses Vorgehen ist angemessen zur Berechnung 
der Assoziationsverteilung. Unter der Annahme von nur einer Beobachtung 
pro Zeitschritt ist dieses Vorgehen aus dargelegten Gründen allerdings nicht 
zielführend für eine Berechnung der aktualisierten Existenzwahrscheinlich- 
keiten. Daher wird in dieser Arbeit ein alternatives Vorgehen zur Berech- 
nung der Existenzwahrscheinlichkeiten gewählt, bei welchem eine separa- 
te Aktualisierung der Existenzwahrscheinlichkeiten in einem Schritt nach 
der Berechnung der Assoziationsverteilung erfolgt. Die Assoziationsvertei- 
lung wird weiterhin nach (5.31) auf Basis der gemeinsamen Existenz- und 
Assoziationswahrscheinlichkeit berechnet, allerdings ohne in (5.31) die aus 
der gemeinsamen Verteilung marginalisierten Existenzwahrscheinlichkei- 
ten p(ExlJı: k) zu verwenden, da diese wie dargelegt nicht mit der getroffe- 
nen Annahme von nur einer Beobachtung vereinbar sind. Zur Berechnung 
der Assoziationswahrscheinlichkeit mittels (5.31) wird stattdessen vereinfa- 
chend angenommen, dass die marginalisierten Existenzwahrscheinlichkei- 
ten hier keinen Einfluss haben, indem z.B. alle p(Ei|Jı:k) als gleich ange- 
nommen werden. Damit ergeben sich die Assoziationswahrscheinlichkeiten 
pË als proportional zur gemeinsamen Wahrscheinlichkeit von Dý und Ej, 


d.h. 


pi ~ p(EL, Dili:e) - (5.46) 
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Diese gemeinsame Wahrscheinlichkeit kann wie bisher durch Marginalisie- 
rung mit E; anhand von (5.29) berechnet werden, so dass insgesamt gilt: 


Pk = p(Ek DiDi) = > P(e Dildı:r) - 
Lel.. ee e Pl 
kekok >k >= êk 


(5.47) 


Die so erhaltenen Werte müssen anschließend noch über alle r in R normiert 
werden (was beim Vorgehen nach [Hor09] unter Verwendung der margina- 
lisierten Existenzwahrscheinlichkeiten erfolgt wäre). Bei Nutzung des ein- 
fachen Modells (5.38) der prioren Assoziation, welches nur Einflüsse des be- 
troffenen Repräsentanten auf die gemeinsame Wahrscheinlichkeit p(ex, dx) 
berücksichtigt, ergibt sich die Assoziationswahrscheinlichkeit eines Reprä- 
sentanten zur Beobachtung f, dann als 


Ir; , ily . 
nf” = Pk - PE pe , (5.48) 
> 20 PE Bee) 
rjER 


also als normiertes Produkt aus der Wahrscheinlichkeit der Messung eines 
Repräsentanten im prädizierten Messmodell mit seiner prädizierten Exis- 
tenzwahrscheinlichkeit. Durch die Normierung ist der Wert unabhängig von 
der Trefferwahrscheinlichkeit pr. Beim komplexeren Modell der prioren As- 
soziation gilt 


pki (2-pr PER |D1:k—1) + PrF: >, „per din) 


2 (pr (2: Pr -PEK |Di:k—1) + Pr "olekla-)) | 


rjeR r#rj 


da’ _ 
Pk = 


(5.49) 


und es wird ersichtlich, dass einerseits die Wahrscheinlichkeiten für Treffer 
Pr sowie für Falschalarme pp eine Rolle spielen (bzw. ihr Verhältnis) und 
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andererseits auch die Existenzwahrscheinlichkeiten anderer Repräsentanten 
bei der Assoziation einer Beobachtung zu r; berücksichtigt werden. 


Die Aktualisierung der Existenzwahrscheinlichkeiten erfolgt schließlich auf 
Basis der berechneten Assoziationswahrscheinlichkeit pe analog zur Ak- 
tualisierung der Attributwahrscheinlichkeiten in (5.28). Hierbei wird für al- 
le Repräsentanten r, die einen Anteil pË > 0 an der Beobachtung haben, 
eine gewichtete Summe gebildet, in welche die beiden Fälle einfließen, dass 
die Entität entweder beobachtet wurde oder nicht, jeweils gewichtet über 
pe bzw. 1 — pe Für den Fall einer Nichtbeobachtung wird dabei die prä- 
dizierte Existenzwahrscheinlichkeit genutzt. Fiir den Fall, dass die Entitat 
tatsachlich beobachtet wurde, wird eine gefilterte Existenzwahrscheinlich- 
keit p(E;,'|Dr) angenommen, die per Definition auf 1 gesetzt wird. Dabei 
wird angenommen, dass eine Entitat, die detektiert wurde, auch mit Sicher- 
heit existiert - und daher die Existenzwahrscheinlichkeit ihres Reprasentan- 
ten auf 1 gesetzt werden sollte unter der Voraussetzung, dass die Entitat 
durch eine Beobachtung erfasst wurde. Dies entspricht dem Vorgehen, die 
Messunsicherheit in einem reinen Detektionsmodell, welchem ein Assozia- 
tionsmodell vorgeschaltet ist, auf Null zu setzen. Mit diesem Vorgehen ergibt 
sich dann die aktualisierte Existenzwahrscheinlichkeit fiir einen Reprasen- 
tanten r als 


p(Erldı:x) = pe > PERDE) + (1- pe) p(Erldı:x-ı) 


oo 
Beobachtete Präd. Existenz 
Existenz 


pe +(1-pk)  PlEidı:-ı) - (5.50) 


5.2.5 Demonstration der Datenassoziation 


Um die grundsätzliche Funktionsfähigkeit des wie vorgestellt erweiterten 
Ansatzes zur Datenassoziation mit den vorgeschlagenen Modellen der prio- 
ren Assoziation zu demonstrieren, wurde eine Simulation durchgeführt. Zu 
diesem Zweck wurde ein abstraktes Szenario angenommen, in welchem En- 
titäten vereinfachend über nur zwei Attribute beschrieben werden, nämlich 
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ein diskretes und ein stetiges Attribut. Dabei wurde fiir das diskrete Attri- 
but ein ordinal skaliertes Merkmal gewählt und für das stetige ein verhält- 
nisskaliertes Merkmal. Als ordinales Attribut a; wird hier beispielhaft die 
Farbe einer Entität verwendet, beschrieben über symbolische Werte f; (wie 
rot, orange, gelb, etc.), die anhand ihrer korrespondierenden Frequenzen im 
Farbspektrum geordnet werden können. Als stetiges Attribut az wird bei- 
spielhaft die Länge der Entität verwendet. 


Betrachtung der Informationsalterung 


Zur Demonstration der Datenassoziation wurden zunächst fünf Entitäten si- 
muliert, welche durch die Repräsentanten 4, P, P, r4 und r; im Weltmodell 
repräsentiert werden. Die Entitäten werden dabei zu verschiedenen Zeit- 
punkten tę beobachtet. Die durch n dargestellte Entität wird beispielsweise 
im Zeitschritt tą mit k = 2 zum ersten Mal beobachtet, und dann erneut im 
Zeitschritt k = 5*. Im Zeitschritt k = 2 wird dementsprechend ein neuer Re- 
präsentant initialisiert, welcher dann über die Zeitschritte k = 3 bis k = 5 
durch Alterung zeitlich fortgeschrieben wird. Dies ist in Abbildung 5.1 dar- 
gestellt. Die Initialisierung (5.1a) erfolgt dabei auf Basis der Beobachtung f}. 
In den folgenden zwei Zeitschritten (5.1b, 5.1c) ohne erneute Beobachtung 
altern die Attribute, wobei hier als Alterungsfaktor für die Existenzwahr- 
scheinlichkeit ein Wert von fe = 0.95 angenommen wurde. Die zeitliche 
Fortschreibung der deskriptiven Attribute erfolgt für das ordinale Farbattri- 
but unter Verwendung des Transitionsmodells (5.17) mit einem Alterungs- 
faktor von Bgi = 0.975. Das kontinuierliche Langenattribut wird anhand 
von (5.13) und (5.14) fortgeschrieben, wobei ein mittelwertfreies Systemrau- 
schen % mit o, = 0.02m angenommen wurde. In Abbildung 5.1c sind die 
prioren Verteilungen der Attribute des Repräsentanten n für den Zeitschritt 
k = 5 dargestellt, und das Absinken der Existenzwahrscheinlichkeit p(E; 2) 
vom Initialwert 1 auf einen Wert von 0.86 wird deutlich. Dies entspricht 


1 Konkrete Zeitschritte tx werden in dieser Arbeit verkürzend durch die Angabe des Werts für 
k spezifiziert, z.B. k = 5 - dies ist gleichbedeutend mit der Notation ts. 
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dem durch den alternativen Ansatz der Assoziationsberechnung intendier- 
ten Verhalten einer langsamen, stetigen Abnahme der Existenzwahrschein- 
lichkeit, wenn eine Entitat über mehrere Zeitschritte hinweg nicht beobach- 
tet wird. Weiterhin ist in 5.1c auch die Zunahme in der Unsicherheit des 
Längenattributs auf einen Wert von of = 0.02 m zu erkennen. 


Betrachtung der Datenassoziation 


Im Zeitschritt k = 5 erfolgt als Resultat der Datenassoziation eine Aktua- 
lisierung des Repräsentanten r, durch die Beobachtung J,;. In der Simula- 
tion wird dabei das einfache Modell (5.38) der prioren Assoziation verwen- 
det. Grundlage für die Berechnung der Datenassoziationsverteilung pe sind 
nach (5.32) und (5.48) die prioren Existenzwahrscheinlichkeiten p(E; ‘) so- 
wie die Attributverteilungen a i aller Repräsentanten r; in R bezüglich der 
Berechnung der prädizierten Messverteilungen. In Abbildung 5.2 sind diese 
Ausgangswerte für die Repräsentanten r (5.2a), r3 (5.2b) und rg (5.2c) dar- 
gestellt. Weiterhin zeigt die Abbildung in 5.2d zum Vergleich die in der Be- 
obachtung f; enthaltenen Messungen für das Farb-Attribut al sowie für das 
Längen-Attribut a2. Die Messwerte J! = f} und $2 = 0.18m sind dabei als 
Verteilungen dargestellt, unter Verwendung der in der Simulation genutzten 
Messabweichungen, nämlich einer Sicherheit von og = 95% bei der Messung 
von Farbmerkmalen sowie einer Messunsicherheit von o, = 0.01 m für die 
Längenmessung. 


Mit den dargestellten Werten ergibt sich für die Datenassoziation im Zeit- 
schritt k = 5 eine Zuordnung d; mit p(D; 2) 2 99.6%. Unter Verwendung 
dieser Zuordnung d, erfolgt dann eine Aktualisierung des Repräsentanten 
h, deren Ergebnis in Abbildung 5.1d dargestellt ist. Dabei ist zu erkennen, 
dass die Existenzwahrscheinlichkeit wie gefordert bei Beobachtung der re- 
präsentierten Entität einen Wert nahe 1 annimmt. Weiterhin werden die At- 
tributverteilungen gemäß den aktuellen Messwerten für die repräsentierten 
Merkmale angepasst. 
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Existenz Farbe Lange 
ple) pla’) pla) 
1.0 1.0 40 
0.5 0.5 20 
0.0 a!l |"? zy, 
i e : + a’/m 
1 0 fifi fp fi fs f 0.0 0.2 0.4 
(a) Initiale Attributverteilungen für Repräsentant r; in Zeitschritt k = 2 
Existenz Farbe Lange 
ple) pla’) pla 
1.0 1.0 40 
0 
0.5 0.5 30 
‚| |10 2 
0.0 e a > a/m 
1 0 fifi fp fi fs f 0.0 0.2 0.4 
(b) Attributverteilungen für Repräsentant r, in Zeitschritt k = 3 
Existenz Farbe Lange 
pe) pla’) pla’) 
1.0 1.0 40 
30 
0.5 0.5 20 
‚10 A 
0.0 e a i > a/m 
1 0 fi fs fi_fs fe 0.0 0.2 0.4 
(c) Priore Attributverteilungen für Repräsentant r3 in Zeitschritt k = 5 
Existenz Farbe Lange 
ple) pa’) pa’) 
1.0 1.0 AO 
30 
0.5 0.5 20 
‚| [10 5 
0.0 e 0.0 1 mma : ; + a/m 
1 0 fi fs fi_fs fe 0.0 0.2 0.4 


(d) Posteriore Attributverteilungen für Repräsentant r3 in Zeitschritt k = 5 


Abbildung 5.1: Szenario fiir die Demonstration der Datenassoziation. Dargestellt ist die Ent- 
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wicklung von Repräsentant r, über 4 Zeitschritte mit Initialisierung in k = 2 
und Alterung über die Zeitschritte k = 3,4,5. In Zeitschritt k = 5 wird rz 
weiterhin durch eine Beobachtung aktualisiert (Ergebnisse eines Aktualisie- 
rungsschrittes in grün dargestellt). 


5.2 Datenassoziation 


Existenz Farbe Lange 
ple) pla’) pla 
1.0 1.0 40 
0.5 0.5 20 
1| 10 A 
0.0 e | 0-0 a San 
1 0 f P 5 J 0.0 0.2 0.4 
(a) Priore Attributverteilungen für Repräsentant r in Zeitschritt k = 5 
Existenz Farbe Länge 
pe) pla’) pa’) 
1.0 1.0 40 
0.5 0.5 20 
10 ww 
0.0 e | 0.0 a l + a/m 
1 0 f P 5 fo 0.0 0.2 0.4 
(b) Priore Attributverteilungen für Repräsentant r3 in Zeitschritt k = 5 
Existenz Farbe Länge 
ple) pa’) pa’) 
1.0 1.0 40 
0.5 0.5 30 
‚| 10 2 
0.0 e | 0.0 a a/m 
1 0 f b 5 Jf 0.0 0.2 0.4 
(c) Priore Attributverteilungen für Repräsentant r4 in Zeitschritt k = 5 
Farbe Länge 
pla’) pla) 
1.0 40 
0.5 20 
‚| 10 
0.0 a —— &@/m 
kh fs fe fe 0.0 0.2 0.4 


(d) Messwerte der Beobachtung J’; in Zeitschritt k = 5 für die Attribute Farbe und Lange, 
dargestellt als Verteilungen mit Messunsicherheiten. 


Abbildung 5.2: Demonstration der Datenassoziation. Dargestellt sind priore Attributvertei- 


lungen für die Repräsentanten F1, F3 und F4, welchen in Zeitschritt k = 5 
zusammen mit dem Repräsentanten r, die dargestellte Beobachtung zuzuord- 
nen ist. 
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Diskussion 


Das für den Zeitschritt k = 5 dargestellte Verhalten kann dabei als exem- 
plarisch fiir eine Demonstration der in der Arbeit erweiterten Datenasso- 
ziation und Informationsverarbeitung in der objektorientierten Umweltmo- 
dellierung angesehen werden. Es ergibt sich in ähnlicher Weise auch in den 
weiteren Zeitschritten, für welche die Simulation durchgeführt wurde. Auch 
bei Verwendung des komplexeren Modells der prioren Assoziation ergeben 
sich in der Simulation grundsätzlich ähnliche Ergebnisse, die das gewünsch- 
te Verhalten der erweiterten Datenassoziation demonstrieren. 


Eine weitere Feststellung lässt sich für den Fall der vereinfachten Modellie- 
rung von Entitäten über nur zwei Attribute treffen. Sie betrifft die zeitliche 
Fortschreibung deskriptiver Attribute im Falle von geringen Werten für Al- 
terungsfaktoren bzw. großer Unsicherheiten in der Prädiktion in Kombinati- 
on mit Repräsentanten, die über viele Zeitschritte nicht beobachtet werden. 
In dieser Situation kann die mit der Zeit auftretende Verbreiterung der Attri- 
butverteilungen dazu führen, dass sich ähnliche Repräsentanten nicht mehr 
ausreichend unterscheiden lassen. In diesem Fall ist dann auch die Daten- 
assoziation nicht mehr in der Lage, zwischen den Repräsentanten zu unter- 
scheiden. Werden Repräsentanten durch eine größere Anzahl von Attributen 
charakterisiert, ist dieser Fall allerdings weniger wahrscheinlich. 


5.3 Informationsverwaltung 


Das objektorientierte Umweltmodell stellt Informationen, welche über die 
relevante Umgebung erworben wurden, weiteren Komponenten eines ko- 
gnitiven Systems zur Nutzung bereit. Um diese Aufgabe gewinnbringend 
und mit entsprechender Informationsqualität ausführen zu können, müs- 
sen im Umweltmodell kontinuierlich Operationen zur Verwaltung der er- 
worbenen Umgebungsinformationen durchgeführt werden. In dieser Arbeit 
werden alle Operationen, welche sich mit der Verwaltung der im Weltmo- 
dell gespeicherten Repräsentanten und ihrer Beziehungen untereinander be- 
schäftigen, zur Informationsverwaltung des Umweltmodells gezählt. Dies 
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beinhaltet auch die probabilistische Informationsverarbeitung [Ghe08]. Ver- 
waltungsoperationen des Weltmodells betreffen unter anderem die Erzeu- 
gung neuer Repräsentanten für bisher unbeobachtete Entitäten, das Löschen 
bzw. Entfernen von nicht mehr als relevant betrachteten Repräsentanten so- 
wie die Verwaltung der Relationen zwischen den Repräsentanten. Weiterhin 
werden Qualitätsprüfungen für Repräsentanten und Relationen im Rahmen 
der Informationsverwaltung durchgeführt, welche die Güte der repräsen- 
tierten Umgebungsinformationen sicherstellen sollen, indem beispielsweise 
Anforderungen an die formale Repräsentation, Konsistenz und Aktualität 
der Umgebungsinformationen umgesetzt werden. Auch die probabilistische 
Zuordnung von Repräsentanten zu Konzepten gehört zur Informationsver- 
waltung. Nachfolgend wird in diesem Abschnitt das Vorgehen der objekt- 
orientierten Umweltmodellierung zur Informationsverwaltung vorgestellt. 
Dieses Vorgehen wurde dabei jeweils in den nachfolgend genannten Vorar- 
beiten festgelegt. Diese Arbeit ergänzt dieses festgelegte Vorgehen an eini- 
gen Stellen nun um weitere Aspekte, z.B. in Bezug auf die Verwaltung von 
Entitätshypothesen. Weiterhin setzt sich diese Arbeit konzeptuell mit der 
Verwaltung von Relationen auseinander. 


5.3.1 Verwaltung von Repräsentanten 


In der objektorientierten Umweltmodellierung wird der Zustand der beob- 
achteten Umgebung durch das Weltmodell mit seinen Repräsentanten und 
Relationen beschrieben. Deren Existenzwahrscheinlichkeit gibt dabei an, für 
wie wahrscheinlich das Vorhandensein der entsprechenden Entitäten und 
Beziehungen in der realen Umgebung gehalten wird. Repräsentanten kön- 
nen somit als Hypothesen über die Existenz sowie die Merkmalsausprägun- 
gen beobachteter Entitäten betrachtet werden. 


In einer sich zeitlich ändernden Umgebung müssen diese Hypothesen dy- 
namisch durch einen entsprechenden Prozess verwaltet werden. Die proba- 
bilistische Informationsverarbeitung sorgt dabei für die Aktualisierung der 
bestehenden Hypothesen. Weiterhin muss nun allerdings auch die Anzahl 
der Hypothesen dynamisch an die aktuellen Verhältnisse angepasst werden. 
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Treten z.B. in der betrachteten Umgebung bisher unbeobachtete Entitäten 
auf, so müssen für diese Entitäten und ihre Merkmalsausprägungen neue 
Hypothesen erzeugt werden. Gleichzeitig kann es passieren, dass ab einem 
gewissen Zeitpunkt bestimmte bestehende Hypothesen aufgrund von Um- 
gebungsinformationen nicht mehr als gültig betrachtet werden können. In 
diesem Fall müssen die entsprechenden Repräsentanten aus dem Weltmodell 
entfernt werden. Diese Betrachtungen gelten analog auch für die Relationen 
zwischen Repräsentanten. 


Das Bestätigen und Verwerfen von Hypothesen über die Existenz von 
Entitäten und Beziehungen in der realen Welt erfolgt im Weltmodell auf 
Basis des Existenzattributs. Sinkt z.B. der Wert des Existenzattributs eines 
im Weltmodell enthaltenen Repräsentanten bzw. einer Relation unter einen 
definierten Minimalwert ab, so wird das entsprechende Objekt aus dem 
Weltmodell entfernt. Die Aufnahme neuer Repräsentanten ins Weltmodell 
ist hingegen ein zweistufiger Prozess, welcher im nachfolgenden Abschnitt 
detailliert beschrieben wird. Dabei wird zunächst zur Repräsentation einer 
bisher unbeobachteten Entität eine neue Entitätshypothese erstellt, welche 
die Merkmalsausprägungen der betrachteten Entität beschreibt sowie eine 
Existenzwahrscheinlichkeit zugeordnet bekommt. Übersteigt diese Exis- 
tenzwahrscheinlichkeit eine definierte Schwelle, so wird die Hypothese 
als bestätigt angesehen und als neuer Repräsentant ins Weltmodell aufge- 
nommen. Über die Existenz neuer Relationen kann basierend auf den im 
Weltmodell enthaltenen Repräsentanten entschieden werden. 


Erzeugung neuer Repräsentanten 


Um eine sich zeitlich ändernde Umgebung modellieren zu können, muss das 
Weltmodell unter anderem in der Lage sein, mit einer dynamischen Anzahl 
an repräsentierten Entitäten umzugehen. Ein wichtiger Aspekt, welcher eng 
mit dem Problem der Datenassoziation verwoben ist, ist dabei die Erzeugung 
zusätzlicher Repräsentanten im Fall des Auftretens neuer, bisher unbeobach- 
teter Entitäten. Dieser Fall muss bereits in der Datenassoziation berücksich- 
tigt werden, indem bei der Zuordnung von Beobachtungen zu gegebenen 
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Repräsentanten auch die zusätzliche Möglichkeit vorgesehen ist, eine Beob- 
achtung keinem der bisherigen Repräsentanten im Weltmodell zuzuordnen, 
sondern als neues Objekt auszuweisen. Die Datenassoziation der objektori- 
entierten Umweltmodellierung basiert auf dem von Horridge und Maskell 
[Hor09] beschriebenen Ansatz. Dieser wurde für das Anwendungsgebiet der 
Verfolgung von Objektpositionen entwickelt und führt zusätzlich zu den be- 
kannten Objekten ein explizites Suchobjekt ein, stellvertretend für bisher 
unbeobachtete Objekte. Das Suchobjekt wird bei der Berechnung der Da- 
tenassoziation wie ein bekanntes Objekt behandelt und kann als Hypothese 
über das Auftreten eines neuen Objekts verstanden werden. 


In dieser Arbeit wird ein Ansatz zur Erzeugung neuer Repräsentanten vor- 
geschlagen, welcher gegenüber den Vorarbeiten zum objektorientierten Um- 
weltmodell [Ghe10a, Bau10] leichte Anpassungen vornimmt. Diese Anpas- 
sungen erfolgen in Analogie zur in dieser Arbeit vorgeschlagenen Erwei- 
terung der Datenassoziation. Der in dieser Arbeit vorgeschlagene Ansatz 
folgt dabei dem Vorgehen in [Hor09] und passt dieses für die objektorientier- 
te Umweltmodellierung an. Wie oben erwähnt, wird dazu ein zweistufiger 
Prozess genutzt, in welchem zunächst Hypothesen für unbekannte Entitä- 
ten erzeugt werden und diese bei Bestätigung dann als Repräsentanten ins 
Weltmodell aufgenommen werden. Zu diesem Zweck hält die Datenassozia- 
tion in jedem Zeitschritt zusätzlich eine Hypothese für neue Beobachtungen 
vor, analog zum Suchobjekt in [Hor09]. Diese Entitätshypothese dient da- 
bei als Stellvertreter-Repräsentant für bisher unbeobachtete Entitäten und 
besitzt Attribute für dieselben Qualitäten wie die Repräsentanten im Welt- 
modell. Im Falle des Auftretens einer unbekannten Entität ordnet die Da- 
tenassoziation nun die entsprechende Beobachtung der Entitätshypothese 
zu (gegebenenfalls auch nur anteilig) und die Attribute der Entitätshypo- 
these werden entsprechend der beobachteten Messwerte aktualisiert. Dies 
betrifft auch die Existenzwahrscheinlichkeit. Überschreitet diese nun nach 
Aktualisierung einen definierten Schwellwert, so wird die aktuelle Entitäts- 
hypothese samt all ihrer Attribute als vollwertiger Repräsentant ins Weltmo- 
dell aufgenommen. Für den nachfolgenden Zeitschritt wird dann eine neue 
Entitätshypothese angelegt. Ist die Existenzwahrscheinlichkeit dagegen zu 
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gering, so wird die aktuelle Entitatshypothese im nachfolgenden Zeitschritt 
probabilistisch weiterverarbeitet. 


In den Vorarbeiten zum objektorientierten Umweltmodell [Ghe10a, Bau10] 
wird ein leicht von diesem Vorgehen abweichender Ansatz zur Erzeugung 
neuer Repräsentanten beschrieben. Hier wird nur für den Fall eines negati- 
ven Ergebnisses der Datenassoziation, d.h. einer Rückweisung aller bisher 
im Weltmodell enthaltenen Repräsentanten, eine neue Entitätshypothese er- 
zeugt und mit initialen Attributwerten belegt. In einem der nachfolgenden 
Zeitschritte muss diese Hypothese dann durch eine erneute Beobachtung 
bestätigt werden und ihre Attribute müssen durch die Messwerte der Be- 
obachtung aktualisiert werden, um als Repräsentant ins Weltmodell aufge- 
nommen zu werden. Der in dieser Arbeit vorgeschlagene, analog zu [Hor09] 
angelegte Ansatz, ständig eine Entitätshypothese vorzuhalten, bietet gegen- 
über dem bisherigen Vorgehen [Ghe10a, Bau10] den Vorteil, dass beim Auf- 
treten einer bisher unbeobachteten Entität die Entitätshypothese direkt mit 
den beobachteten Merkmalsausprägungen aktualisiert und ins Weltmodell 
aufgenommen werden kann. 


Nachfolgend werden die Details der probabilistischen Verarbeitung der Enti- 
tätshypothese in dieser Arbeit beschrieben. Die Entitätshypothese wird hier- 
bei als rọ bezeichnet und durch den Index 0 symbolisiert. Zunächst werden 
beim Anlegen einer neuen Entitätshypothese die Attributverteilungen mit 
vordefinierten Werten initialisiert. Die Werte repräsentieren das Vorwissen 
über mögliche Ausprägungen eines jeden Merkmals innerhalb der betrach- 
teten Domäne und sind in Form von A-priori-Verteilungen gegeben. Details 
für eine mögliche Bestimmung solcher A-priori-Verteilungen werden in Ab- 
schnitt 6.4.2 beschrieben. Auch für die Existenzwahrscheinlichkeit wird ein 
Initialwert festgelegt, welcher die Unsicherheit über das tatsächliche Exis- 
tieren der entsprechenden Entität widerspiegeln soll. Anschließend wird die 
Entitätshypothese in jedem Zeitschritt probabilistisch verarbeitet, also zeit- 
lich fortgeschrieben, anteilig mit der Beobachtung des Zeitschritts assoziiert 
und entsprechend aktualisiert. 
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Im Ansatz von Horridge und Maskell [Hor09] weicht die zeitliche Fortschrei- 
bung der Existenzwahrscheinlichkeit des Suchobjekts leicht vom fiir Repra- 
sentanten in Vorarbeiten etablierten Vorgehen ab. Hier wird mit einer be- 
stimmten Wahrscheinlichkeit auch die Möglichkeit berücksichtigt, dass das 
Suchobjekt im aktuellen Zeitschritt nicht ein bereits in einem der vorher- 
gehenden Zeitschritte entdecktes Objekt beschreibt, sondern ein im aktu- 
ellen Zeitschritt komplett neu entdecktes Objekt. Das Auftreten dieses Fal- 
les wird dabei mit der Wahrscheinlichkeit P(Ex 1) gewichtet, welche das 
Nicht-Existieren des Suchobjektes im direkt vorhergehenden Zeitschritt t,_1 
beschreibt. Im entgegengesetzten Fall mit der Wahrscheinlichkeit pe) 
dass das Suchobjekt bereits existierte, wird diese Wahrscheinlichkeit wie 
bisher mit einem vordefinierten Faktor gemindert. Beide Falle werden in 
[Hor09] zur zeitlichen Fortschreibung der Existenzwahrscheinlichkeit des 
Suchobjekts additiv kombiniert. Fiir die zeitliche Fortschreibung der Enti- 
tatshypothese rg wird in dieser Arbeit das beschriebene Vorgehen in ange- 
passter Form übernommen. Hierbei wird die Konvexkombination 


P(EK°) := p(k?) P(Eo°) + p(Ep21) > p(Ekt1) (5.51) 
ee? enamine” 
Gewichtung Gewichtung 


gebildet, in welcher der Term p (7) in zwei unterschiedlichen Rollen 
auftritt. Dabei ist die Wahrscheinlichkeit einer im aktuellen Zeitschritt neu 
beobachteten Entität durch die initiale Existenzwahrscheinlichkeit p (E0°) 
gegeben und die Wahrscheinlichkeit, eine in einem vorherigen Zeitschritt 
neu entdeckte Entität weiter zu beobachten, durch die bisherige Existenz- 
wahrscheinlichkeit DIE). Die Gewichtung bleibt unverändert gegenüber 
dem Vorgehen in [Hor09]. Insgesamt ergeben sich bei diesem Ansatz Werte 
zwischen p(Ey°) und p(E,°,) sowie im Speziellen Werte ~ p(Ey°) für 
p (E2) < PE’). 


Demselben Prinzip folgend, wird analog zu [Hor09] auch bei der Prädikti- 
on der deskriptiven Attribute ap der Entitätshypothese rp die Möglichkeit 
berücksichtigt, dass aktuell eine komplett neue Entität beobachtet wurde. 
Dabei werden die aktuellen Attribute der Entitätshypothese mit initialen 


217 


5 Probabilistische Informationsverwaltung in der Umweltmodellierung 


Attributwerten kombiniert, wobei letztere wieder mit der Wahrscheinlich- 
keit p(E i) der bisherigen Nicht-Existenz der Entitätshypothese gewichtet 
werden, und erstere mit DEN). An dieser Stelle sei angemerkt, dass für 
stetige Attribute durch diese Kombination eine Zunahme der Komponen- 
ten in ihrer Verteilung auftreten kann, so dass hier die Durchführung einer 
Komponentenreduktion sinnvoll sein kann. 


Die Assoziation der Entitätshypothese zu einer Beobachtung erfolgt dann 
nach dem in Abschnitt 5.2.2 beschriebenen Schema. Auch die aktualisier- 
te Existenzwahrscheinlichkeit kann anschließend anhand der bestimmten 
Assoziationsverteilung wie in 5.2.4 beschrieben berechnet werden. Dieser 
aktualisierte Wert bildet nun die Grundlage für die Entscheidung über die 
Aufwertung der Entitätshypothese zu einem vollwertigen Repräsentanten 
des Weltmodells [Hei10]. Dies ist der Fall, wenn die aktualisierte Existenz- 
wahrscheinlichkeit p(EL°) den Schwellwert y überschreitet. 


Für den Fall einer Aufwertung der Entitätshypothese gehen nach [Hor09] 
keine Anteile aus einer möglichen Fehldetektion ein. Umgesetzt für die Da- 
tenassoziation im objektorientierten Umweltmodell bedeutet dies, dass im 
Falle einer Aufwertung bei Aktualisierung der deskriptiven Attribute der 
Entitätshypothese in (5.23) kein direkter Anteil der prioren Verteilung ein- 
geht, sondern nur die Ergebnisse des Filterschritts berücksichtigt werden, 
äquivalent zu př = 1. Wird dagegen die Entitätshypothese nicht aufgewer- 
tet, erfolgt die Aktualisierung der deskriptiven Attribute wie in Abschnitt 
5.2.1 beschrieben. Als Ersatz für eine aufgewertete Entitätshypothese wird 
anschließend eine neue Hypothese erzeugt und mit den für die Attribute 
definierten Initialwerten belegt. 


Weiterhin sei angemerkt, dass durch die Einführung der Entitätshypothe- 
se allgemein sowie im Falle einer Aufnahme eines neuen Repräsentanten 
die Erweiterung einiger Vektoren der Datenassoziation, z. B. des Vektors der 
Existenzwahrscheinlichkeiten e,, sowie der Wertebereich der Assoziations- 
variablen dy notwendig wird. 
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5.3.2 Entfernen von Repräsentanten 


Die Informationsverwaltung sieht neben der Erzeugung neuer Repräsen- 
tanten auch die Möglichkeit vor, nicht mehr relevante Repräsentanten zu 
löschen, d.h. aus dem Weltmodell zu entfernen. Die Motivation hierfür 
ist eine Schlankhaltung des Weltmodells [Heil0] in dem Sinne, dass Re- 
präsentanten entfernt werden, wenn sie als veraltet gelten. Die Alterung 
eines Repräsentanten ist aufgrund der probabilistischen Informations- 
verarbeitung gleichbedeutend mit einer Zunahme der Unsicherheit in 
Existenzwahrscheinlichkeit sowie in deskriptiven Attributen des Repräsen- 
tanten. Ein schlankes Weltmodell bietet den Vorteil, dass Verarbeitungs- und 
Verwaltungsoperationen mit weniger Aufwand durchgeführt werden kön- 
nen. Dies betrifft sowohl die Informationsverwaltung im objektorientierten 
Umweltmodell mitsamt der probabilistischen Informationsverarbeitung 
als auch von anderen Komponenten des kognitiven Systems ausgehende 
Informationsanfragen an das Umweltmodell. 


Die Entscheidung darüber, ob ein Repräsentant aus dem Weltmodell zu lö- 
schen ist, wird auf Basis seiner aktuellen Existenzwahrscheinlichkeit getrof- 
fen. Ein Repräsentant r wird aus dem Weltmodell gelöscht, wenn seine ak- 
tualisierte Existenzwahrscheinlichkeit einen vorgegebenen Schwellwert un- 
terschreitet: p(EL) < Ye [Heil0, Ghe10b, Bau10]. Dies gilt ebenso für Rela- 
tionen, deren Verwaltung genauer im Abschnitt 5.3.4 beschrieben wird. 


Abbildung 5.3 zeigt den Zusammenhang zwischen y; und dem Schwellwert y; 
für die Erzeugung neuer Repräsentanten in der objektorientierten Umwelt- 
modellierung. Die gezeigte Kurve beschreibt dabei eine Hysterese. Die In- 
tension des gewählten Zusammenhanges ist es, dass Repräsentanten nach 
ihrer Erzeugung nicht direkt wieder gelöscht werden [Hei10], sondern sich 
ihnen die Möglichkeit bietet, durch eine erneute Beobachtung der repräsen- 
tierten Entität innerhalb eines gewissen Zeitrahmens bestätigt zu werden. 
Die Länge dieses Zeitrahmens hängt dabei von den genutzten Alterungsfak- 
toren ß ab. 
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Weiterhin kann zusätzlich der Schwellwert y. genutzt werden, welcher als 
ein Auslöser dient, um eine gezielte Wiederbestätigung der Existenz der re- 
präsentierten Entität durch eine Sensorbeobachtung zu veranlassen [Bel09, 
Heil0]. Dies kann z.B. im Rahmen der Qualitätsprüfungen erfolgen. Eine 
aktive Wiederbestätigung setzt allerdings eine Anfrageschnittstelle zur Sen- 
sorsteuerung des kognitiven Systems voraus. 


&% 
Löschen Initialisierung 
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Abbildung 5.3: Schwellwerte y; für das Erzeugen und Ye für das Löschen von Repräsentan- 
ten als Hysterese, welche eine ausreichend große Zeitspanne zwischen beiden 
Ereignissen sicherstellen soll, sowie y, für das Auslösen einer Wiederbestäti- 
gungsanforderung (nach [Hei10, Ghe10a)). 


Archivierung erworbener Informationen 


Im Zusammenhang mit dem Entfernen von Repräsentanten aus dem Welt- 
modell stellt sich eine grundsätzliche Frage. Diese Frage ist, ob einmal erwor- 
bene Umgebungsinformationen wieder verworfen, d.h. endgültig gelöscht 
werden sollten, falls sie aktuell nicht mehr relevant erscheinen, oder ob die- 
se besser für eine mögliche spätere Verwendung nur ausgelagert werden 
sollten, z.B. durch Archivierung. 


Dass ein endgültiges Löschen nicht immer vorteilhaft ist, wird in Vorarbei- 
ten zum objektorientierten Umweltmodell anhand des Beispiels motiviert, 
dass aktuell nicht mehr beobachtbare Repräsentanten nach gewisser Zeit 
wieder relevant werden können [Bel09]. Als ein Beispiel aus der Haushalts- 
domäne wird dabei in [Bel09] konkret Geschirr genannt, welches sich für 
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einen Zeitraum in einer Spülmaschine befindet. Während dieser Zeit könn- 
ten die Repräsentanten für diese Geschirrteile nun aus dem Weltmodell ge- 
löscht werden. Das Beispiel merkt weiterhin an, dass das Geschirr nach Ende 
des Spülvorgangs wieder aus der Spülmaschine ausgeräumt werden muss. 
Zu diesem Zweck kann das Wissen, dass sich die Geschirrteile in der Spül- 
maschine befinden, und welche Eigenschaften diese Geschirrteile besitzen, 
wieder hilfreich sein. 


Der Schlankhaltung des Weltmodells durch Löschen von veralteten Reprä- 
sentanten steht weiterhin der Erfahrungswert gegenüber, welcher ein Re- 
präsentant darstellt. Dieser ist in Form der über die relevante Umwelt er- 
worbenen Informationen im Repräsentanten gegeben, welche in den Ver- 
teilungen seiner perzeptiven und deduktiven Attribute vorliegen. Für zu- 
standsbezogene, zeitabhängige Attribute kann dies beispielsweise die Posi- 
tion der dargestellten Entität zum entsprechenden Zeitpunkt sein, oder auch 
ihr Alter (z.B. für Lebensmittel) oder aktuelle Verwendbarkeit. Auch stati- 
sche Attribute können einen Erfahrungswert darstellen, wie z. B. die tatsäch- 
lichen Abmessungen oder konkrete Farbe eines beobachteten Gegenstandes, 
gegenüber den im entsprechenden Konzept des Hintergrundwissens model- 
lierten allgemeineren Attributwerten. Unter Betrachtung dieses Erfahrungs- 
werts bietet sich eine Archivierung bestimmter Repräsentanten als Alterna- 
tive zu ihrer endgültigen Löschung aus dem Weltmodell an. Als wie wert- 
voll spezifische Informationen über beobachtete Entitäten eines bestimmten 
Typs betrachtet werden, hängt von den konkreten Aufgabenstellungen eines 
kognitiven Systems ab und kann bereits zur Modellierungszeit des Systems 
definiert werden. Zu diesem Zweck lässt sich in entsprechenden Konzepten 
des Hintergrundwissens beispielsweise ein Individualitätsfaktor festlegen, 
welcher bestimmt, als wie wertvoll die durch Beobachtung einer Entität des 
entsprechenden Typs erworbenen Informationen angesehen werden. Als je 
wertvoller diese Informationen gelten, desto eher sollte ein entsprechender 
Repräsentant nicht endgültig aus dem Weltmodell gelöscht, sondern archi- 
viert werden. 
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Im objektorientierten Umweltmodell können die Zustandshistorie sowie zu- 
sätzliche Mechanismen für eine Archivierung relevanter Repräsentanten ge- 
nutzt werden, welche in Abschnitt 5.4 genauer beschrieben werden. 


5.3.3 Qualitätsprüfungen 


Im Weltmodell wird der beobachtete Umgebungszustand repräsentiert. Die- 
ser Zustand stellt dabei das Ergebnis der Fusion von Informationen dar, wel- 
che von unterschiedlichen Sensoren, zu verschiedenen Zeitpunkten und in 
wechselnden Situationen ermittelt werden können. Bei dieser Heterogenität 
kann nicht ausgeschlossen werden, dass erworbene Informationen sich teil- 
weise widersprechen, veraltet oder in Kombination nicht realisierbar sind. 
Um solche Zustände im Weltmodell zu vermeiden, werden regelmäßig Qua- 
litätsprüfungen durchgeführt [Ghe08, Ghe10b]. Dabei wird zwischen Kon- 
sistenzprüfungen, Gültigkeitsprüfungen, Relevanzprüfungen und Aktuali- 
tätsprüfungen unterschieden [Ghe10b]. 


Konsistenzprüfungen setzen semantische Einschränkungen an die mögli- 
chen Konfigurationen einer Szene mit dem Ziel um, nur gültige Umgebungs- 
zustände im Weltmodell zu repräsentieren [Ghe08]. Dabei sollen unter an- 
derem grundlegende physikalische Gegebenheiten modelliert werden, bei- 
spielsweise, dass Gegenstände nicht in der Luft schweben oder zwei Ge- 
genstände nicht denselben Raum einnehmen können. Konsistenzprüfungen 
sollten bei jeder Integration neuer Umgebungsinformationen durchgeführt 
werden, können aus Performanzgründen allerdings auch periodisch ange- 
stoßen werden. Neben Konsistenzprüfungen können zur Wahrung der Qua- 
lität der repräsentierten Umgebungsinformation weitere Prüfungen durch- 
geführt werden. Gültigkeitsprüfungen betreffen dabei die formale Korrekt- 
heit der Informationsrepräsentation. Relevanzprüfungen betreffen die Signi- 
fikanz neuer Umgebungsinformationen in Bezug auf die aktuellen Aufgaben 
des kognitiven Systems. Aktualitätsprüfungen betreffen schließlich die Fra- 
ge, ob die repräsentierten Informationen noch aktuell sind und stoßen gege- 
benenfalls eine Wiederbestätigung der Informationen an [Ghe10b]. Alle Prü- 
fungen werden dabei über entsprechende Regeln realisiert. Weitere Details 
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zu Qualitätsprüfungen geben die entsprechenden Vorarbeiten von Gheta et 
al. [Ghe08, Ghe10b]. 


5.3.4 Verwaltung von Relationen 


Die meisten bisherigen Veröffentlichungen über das objektorientierte Um- 
weltmodell konzentrieren sich beim Thema Informationsverwaltung auf die 
Verwaltung von Repräsentanten und deren Zuordnung zu den Konzepten 
des Hintergrundwissens. Repräsentanten setzen dabei eine objektbasierte 
Strukturierung der über die Umgebung erworbenen Informationen um. Re- 
lationen zwischen Repräsentanten werden in der objektorientierten Um- 
weltmodellierung dagegen detaillierter nur im Kontext der Situationsana- 
lyse von Fischer [Fis11, Fis12, Fis16] betrachtet. Diese ist allerdings bereits 
als eine dem Umweltmodell nachgelagerte Verarbeitungskomponente aus- 
gelegt. Um in dieser Arbeit eine möglichst allgemeine Darstellung des The- 
mas der Informationsverwaltung geben zu können, fließen an dieser Stelle 
einige grundlegende Betrachtungen zur Verwaltung von Relationen in der 
objektorientierten Umweltmodellierung ein. Diese Betrachtungen sind dabei 
an den Prinzipien des objektorientierten Umweltmodells sowie am Vorgehen 
zur Verwaltung von Repräsentanten orientiert. Weiterhin berücksichtigen 
sie die grundlegenden Festlegungen von Metamodell bzw. Kern-Ontologie. 
Diese erlauben z.B. eine strukturierte Betrachtung der Thematik im Hin- 
blick auf unterschiedliche Szenarmodi für Relationen. Die in dieser Arbeit 
angestellten Betrachtungen verbleiben allerdings bis auf einzelne Beispiele 
ihrer Ausrichtung nach abstrakt. Eine tiefere Auseinandersetzung mit dem 
Thema, z.B. in Bezug auf die konkrete Verwaltung einzelner Relationen mit 
bestimmter Bedeutung, liegt außerhalb des Rahmens dieser Arbeit. 


Unterscheidung von Relationen nach Szenarmodus 
Prinzipiell lassen sich wie für Attribute auch bei Relationen verschiedene 


Modi der Anwendung unterscheiden. Relationen können dabei in einem per- 
zeptiven, deduktiven oder semantischen Szenarmodus verwendet werden. 
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Fir Relationen im perzeptiven Szenarmodus kann die Existenz einer Be- 
ziehung zwischen Entitäten direkt über Sensoren erfasst werden [Fis12]. 
Dies ist in der Praxis allerdings weniger häufig der Fall. Häufiger muss über 
die Existenz von Relationen auf Grundlage von Repräsentanten entschieden 
werden unter Verwendung der Verteilungen ihrer perzeptiven und deduk- 
tiven Attribute. In diesem Fall besitzen derart inferierte Relationen einen 
deduktiven Szenarmodus. Sie dienen der Weiterverarbeitung von Informa- 
tionen und können beispielsweise als Basisvokabular zur Definition von hö- 
herwertigen Abstraktionen wie Aufgaben und Situationen genutzt werden 
[Fis11]. Als Beispiele für solche deduktive Relationen lassen sich räumliche 
Beziehungen nennen („x steht auf y“, „x liegt links von y“) sowie Inklusions- 
beziehungen (,x befindet sich in y“). 


Schließlich lassen sich noch Relationen mit semantischem Szenarmodus un- 
terscheiden, deren Existenz sich aus der Klassenzugehörigkeit von Reprä- 
sentanten ergibt. Diese Relationen verkörpern dabei Vorwissen, welches in 
Form von Relationen zwischen Konzepten bereits im Hintergrundwissen 
modelliert ist. Auf Repräsentanten, welche als Instanzen eines derartigen 
Konzepts angesehen werden, gehen diese modellierten Relationen somit au- 
tomatisch über. Als Beispiele solcher semantischer Relationen lassen sich 
Rollen und Funktionen nennen („x dient als y“, „x besitzt Funktion y“) sowie 
Teile-Ganzes Beziehungen (,x ist Teil von y“). 


Erzeugung neuer Relationen 


Die Erzeugung von Relationen ist Teil der Informationsverwaltung im ob- 
jektorientierten Umweltmodell. Relationen werden dabei in Abhängigkeit 
ihres Szenarmodus erzeugt. Semantische Relationen ergeben sich beispiels- 
weise ereignisgetrieben aufgrund der Zuordnung eines Repräsentanten zu 
einem Konzept. Perzeptive und deduktive Relationen stellen dagegen Aus- 
sagen über bestimmte, in der beobachteten Umgebung vorliegende Bezie- 
hungen zwischen Entitäten dar. Dementsprechend bilden die Eigenschaften 
dieser Entitäten, dargestellt als die Attribute von Repräsentanten, die Grund- 
lage für die Entscheidung über die Erzeugung solcher Relationen. 
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Perzeptive Relationen Fiir perzeptive Relationen wird diese Entscheidung 
bereits in entsprechenden Sensorsystemen getroffen, also dem Umweltmo- 
dell vorgelagert. Dabei miissen dem Weltmodell alle notwendigen Informa- 
tionen zu einer zu erzeugenden Relation geliefert werden: Art und Typ der 
Beziehung, die an ihr beteiligten Entitäten sowie die Eigenschaften der Be- 
ziehung, inklusive der durch den Sensor bestimmten Existenzwahrschein- 
lichkeit. Art und Typ der Beziehung werden dabei in Form von im Hinter- 
grundwissen modellierten Relationskonzepten beschrieben. Die an der Be- 
ziehung beteiligten Entitäten können entweder als Verweise auf bereits exis- 
tierende Repräsentanten angegeben werden oder in Form von Beobachtun- 
gen. Im letzteren Fall müssen die beteiligten Repräsentanten im Weltmodell 
durch Datenassoziation bestimmt werden. In Abhängigkeit davon, ob bereits 
eine Relation gegebener Art und Typs zwischen den identifizierten Reprä- 
sentanten besteht, wird dann diese Relation entweder aktualisiert oder eine 
neue Relation ins Weltmodell aufgenommen. 


Deduktive Relationen Im Weltmodell selbst muss nur die Erzeugung sol- 
cher Relationen betrachtet werden, welche im Hintergrundwissen als de- 
duktiv ausgewiesen werden. Für die Erzeugung neuer deduktiver Relationen 
lassen sich zunächst pro Zeitschritt auf Basis der Repräsentanten im Welt- 
modell Relationshypothesen bestimmen, welche über Attribute beschrieben 
werden. Das in diesem Kontext wichtigste Attribut ist die berechnete Exis- 
tenzwahrscheinlichkeit der Relationshypothese. Überschreitet diese einen 
festgelegten Schwellwert f, so wird die Relationshypothese als neue Relati- 
on ins Weltmodell aufgenommen, anderenfalls wird sie verworfen. Um die 
Existenzwahrscheinlichkeit einer deduktiven Relation berechnen zu kön- 
nen, muss definiert werden, wie sich diese in Abhängigkeit der Attribute 
von Repräsentanten ergibt. Eine solche Festlegung erfolgt a priori im Rah- 
men der Domänenmodellierung, wenn entsprechende Relationskonzepte für 
Typen von Beziehungen im Hintergrundwissen definiert werden. Die Relati- 
onskonzepte enthalten dabei Bedingungen und Rechenvorschriften für ihre 
Instanziierung, d.h. für die Erzeugung entsprechender Relationen. 
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Probabilistische Erzeugung von Relationen Um mit der probabilisti- 
schen Informationsverarbeitung im Umweltmodell vertraglich zu sein, miis- 
sen die Berechnungsvorschriften zur Erzeugung von Relationen als Funktio- 
nen über Zufallsvariablen gegeben sein. Diese Zufallsvariablen stellen die 
Attribute der beteiligten Reprasentanten dar. Als Ergebnis dieser Funktio- 
nen wird die Existenzwahrscheinlichkeit einer Relation berechnet. 


Die direkte Definition probabilistischer Kriterien fiir das Vorliegen von Re- 
lationen ist nicht einfach zu bewerkstelligen. Diese Aufgabe kann selbst fiir 
Domänenexperten unintuitiv und schwierig sein. Eine Möglichkeit, diesen 
Prozess zu vereinfachen, besteht in einer Aufteilung der Berechnungsvor- 
schriften in Anteile für eine probabilistische Vorverarbeitung einerseits und 
darauf aufsetzende Entscheidungskriterien andererseits. Entscheidungskri- 
terien stellen dabei Funktionen dar, welche über einem relevanten Definiti- 
onsbereich Werte aus dem Intervall [0,1] annehmen. 


So kann z.B. eine probabilistische deduktive Relation von Typ „nahe bei“ 
auf Basis der Positionen der zwei beteiligten Repräsentanten definiert wer- 
den. Um die Existenzwahrscheinlichkeit der Relation zu bestimmen, können 
zunächst die probabilistisch repräsentierten Positionskoordinaten in eine 
Wahrscheinlichkeitsverteilung für den Abstand zwischen den beiden Reprä- 
sentanten umgerechnet werden. Der Abstand wird somit durch eine Zufalls- 
variable probabilistisch repräsentiert. Für den Abstand kann weiterhin ein 
nicht-probabilistisches Entscheidungskriterium angegeben werden, welches 
bestimmt, ob eine Relation von Typ „nahe bei“ zwischen den beiden betrach- 
teten Repräsentanten vorliegt. Dazu kann beispielsweise ein Schwellwert 
genutzt werden, unterhalb dessen die Relation als vorliegend angenommen 
wird. Dies entspricht einer gespiegelten und verschobenen Stufenfunktion. 
Die Erwartung über das Vorliegen der Relation, gegeben als Erwartungs- 
wert über die Entscheidungsfunktion bzgl. des probabilistisch repräsentier- 
ten Abstands, kann dann als Existenzwahrscheinlichkeit für die Relation be- 
trachtet werden. Auf diese Weise können z. B. räumliche Relationen definiert 
werden, die in den Attributen von Repräsentanten verankert sind (vgl. Ab- 
schnitt 4.4.3). 
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Um nicht nur binäre, sondern auch abgestufte Entscheidungen zu erlau- 
ben, bietet sich die Verwendung einer Art Zugehörigkeitsfunktion (aus 
dem Gebiet der unscharfen Mengen) als Entscheidungsfunktion an. Diese 
Funktion kann dabei als ein gemischt diskret-stetiges Transitionsmodell 
dienen, welches die gemeinsame Wahrscheinlichkeitsverteilung von Exis- 
tenzwahrscheinlichkeit der Relation und dem Ergebnis der probabilistischen 
Vorverarbeitung darstellt. Die Existenzwahrscheinlichkeit kann in diesem 
Fall durch Berechnung des Chapman-Kolmogorov Integrals dieser Transiti- 
onsdichte mit dem Ergebnis der probabilistischen Vorverarbeitung bestimmt 
werden. Dies entspricht der Berechnung einer erwarteten Zugehörigkeit 
bzgl. des Vorverarbeitungsergebnisses. 


Die Möglichkeit der oben beschriebenen Aufteilung stellt ein prinzipielles 
Vorgehen zur Modellierung der Existenzwahrscheinlichkeit von Relatio- 
nen dar. Für einfach definierbare Relationen, wie z.B. die obige „nahe 
bei“ Beziehung, kann dieses Vorgehen wie beschrieben angewendet wer- 
den. Für nur komplexer beschreibbare Relationen kann es erforderlich 
sich, dieses Vorgehen zu erweitern. Eine Möglichkeit ist es dabei, meh- 
rere Teil-Entscheidungskriterien zu definieren, die jeweils auf Basis einer 
probabilistischen Teil-Vorverarbeitung basieren, und die Ergebnisse die- 
ser Teilkriterien dann unter Anwendung entsprechender Operatoren zu 
kombinieren. Zu diesem Zweck können z.B. Operatoren der Fuzzy Logik 
genutzt werden. 


Zur Erzeugung von Relationen (bzw. Relationshypothesen) eines bestimm- 
ten Typs können in jedem Zeitschritt die im Weltmodell enthaltenen Reprä- 
sentanten gegen im Hintergrundwissen definierte Relationskonzepte vergli- 
chen werden. Die berechnete Existenzwahrscheinlichkeit für eine Relation 
lässt sich dabei als eine bedingte Wahrscheinlichkeit verstehen. Die Wahr- 
scheinlichkeit ist dabei bedingt auf die Existenz der beteiligten Repräsentan- 
ten. Die tatsächliche Existenzwahrscheinlichkeit ergibt sich schließlich als 
das Produkt dieser bedingten Existenzwahrscheinlichkeit mit den Existenz- 
wahrscheinlichkeiten aller beteiligten Repräsentanten. Überschreitet diese 
tatsächliche Wahrscheinlichkeit den Schwellwert 7%, so wird die Hypothese 
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als neue Relation ins Weltmodell aufgenommen, anderenfalls wird die Hy- 
pothese verworfen. 


Die Erzeugung neuer semantischer Relationen erfolgt ebenfalls auf Grundla- 
ge der im Weltmodell enthaltenen aktualisierten Repräsentanten, basierend 
auf deren Repräsentant-zu-Konzept Zuordnung. Wird diese erstmalig für 
einen neu zum Weltmodell hinzugefügten Repräsentanten berechnet oder 
ändert sich für einen Repräsentanten das zugeordnete Konzept, so werden 
Hypothesen über neue semantische Relationen für die entsprechenden Re- 
präsentanten erzeugt. Die Existenzwahrscheinlichkeiten dieser Relationshy- 
pothesen ergeben sich dabei aus den Unsicherheiten der Repräsentant-zu- 
Konzept Zuordnung für das entsprechende Konzept. Liegen diese über %, so 
werden auch hier die Hypothesen als neue Relationen ins Weltmodell auf- 
genommen, und anderenfalls verworfen. 


Aktualisierung von Relationen 


Neben der Erzeugung von Relationen zählt auch die Aktualisierung exis- 
tierender Relationen zu den Aufgaben der Informationsverwaltung. Da alle 
in Relationen enthaltenen Informationen allerdings auf den Attributen der 
Repräsentanten des Weltmodells basieren, bietet eine Aktualisierung von 
Relationen durch eine probabilistische Informationsverarbeitung im Allge- 
meinen keinen informationsbezogenen Mehrwert, z. B. im Sinne einer redu- 
zierten Unsicherheit. Dieselben Informationen lassen sich in gleicher Wei- 
se durch die standardmäßig ausgeführte Aktualisierung der Repräsentanten 
und eine anschließende Neuberechnung der Relationen gewinnen. Dies be- 
trifft auch die zeitliche Fortschreibung von Relationen. Allerdings gibt es An- 
wendungsfälle, in denen eine probabilistische Weiterverarbeitung von Rela- 
tionen aus anderen Gründen vorteilhaft sein kann, z. B. um eine Glättung in 
der zeitlichen Entwicklung der Informationen zu erreichen [Fis16]. 


Für die zeitliche Fortschreibung der Existenzwahrscheinlichkeit einer Rela- 
tion ergibt sich der exakte Wert durch Neuberechnung, nachdem die zeitli- 
che Fortschreibung aller Repräsentanten im Weltmodell erfolgt ist. In die- 
se Berechnung gehen dann direkt die gealterten Attributverteilungen und 
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Existenzwahrscheinlichkeiten der Reprasentanten ein. Fiir semantische Re- 
lationen muss zuvor die Repräsentant-zu-Konzept Zuordnung auf Basis der 
aktualisierten Repräsentanten ebenfalls neu berechnet werden. 


Als Alternative kann ein approximativer Ansatz zur zeitlichen Fortschrei- 
bung der Existenzwahrscheinlichkeit gewählt werden, welcher analog zur 
Alterung von Repräsentanten ausgelegt ist. Bei diesem Ansatz muss für 
jedes Relationskonzept ein entsprechender Alterungsfaktor definiert wer- 
den, welcher die Abnahme der Existenzwahrscheinlichkeit der Relation 
pro Zeitschritt beschreibt. Für die zeitliche Fortschreibung der Relation 
wird ihre Existenzwahrscheinlichkeit dann zunächst anhand dieses Al- 
terungsfaktors gemindert. Um ein einheitliches Vorgehen im Vergleich 
zur Erzeugung von Relationen zu gewährleisten, muss die geminderte 
Existenzwahrscheinlichkeit anschließend noch mit den Alterungsfaktoren 
der an der Relation beteiligten Repräsentanten multipliziert werden, der 
Abnahme ihrer Existenzwahrscheinlichkeiten durch Alterung Rechnung 
tragend. Die Alterungsfaktoren semantischer Relationen werden hierbei 
häufig den Wert 1 annehmen, da die Existenz der Relationen bereits im 
Hintergrundwissen modelliert wurde und somit als statisch angesehen 
werden kann. Dieser alternative Ansatz ist allerdings in dem Sinne approxi- 
mativ, als dass die berechneten Werte nicht notwendigerweise mit den sich 
durch Neuberechnung ergebenden Werten übereinstimmen müssen. Der 
Alterungsfaktor einer Relation ist agnostisch z. B. für die Typen der an einer 
Relation beteiligten Repräsentanten sowie für die zeitliche Fortschreibung 
der enthaltenen deskriptiven Attribute. Dies führt zu einer Inkonsistenz 
der im Weltmodell repräsentierten Informationen, welcher ein reduzier- 
ter Berechnungsaufwand für Relationen gegenübersteht. Abhängig vom 
Anwendungsfalls kann dies eine gewünschte Situation sein. 


Entfernen von Relationen 
Ein weiterer Punkt der Verwaltung von Relationen ist die Entfernung von 


nicht mehr als relevant angesehenen Relationen aus dem Weltmodell. Da- 
bei lässt sich dasselbe Vorgehen wie bei Repräsentanten anwenden: sinkt 
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die Existenzwahrscheinlichkeit einer Relation unter einen Schwellwert f, so 
gilt diese als nicht mehr relevant und wird aus dem Weltmodell entfernt. Eine 
durch einen weiteren Schwellwert ausgelöste Wiederbestatigung ist im Fal- 
le von Relationen nur bedingt sinnvoll, da sich die Existenzwahrscheinlich- 
keit einer Relation direkt aus den Attributen der beteiligten Repräsentanten 
ergibt. Sinnvoll könnte in einem solchen Fall das Durchreichen der Wieder- 
bestätigungsanforderung an die beteiligten Repräsentanten sein. Weiterhin 
müssen auch diejenigen Relationen aus dem Weltmodell entfernt werden, 
welche sich auf Repräsentanten beziehen, die ihrerseits nicht mehr im Welt- 
modell enthalten sind. Dies kann erfolgen, indem beim Entfernen eines Re- 
präsentanten aus dem Weltmodell zugleich alle Relationen entfernt werden, 
an welchen der Repräsentant beteiligt war. 


Aus dem Weltmodell entfernte Relationen werden, analog zu entfernten Re- 
präsentanten, in der Zustandshistorie des Umweltmodells archiviert. Auch 
für Relationen sind dabei anwendungsbezogene Unterscheidungen desjeni- 
gen Werts vorstellbar, welchen die Archivierung einer Relation eines be- 
stimmten Typs darstellt. Dieser Wert kann dabei a priori in den Relations- 
konzepten hinterlegt werden. Beispielsweise kann die Information, dass sich 
ein bestimmter Gegenstand innerhalb eines anderen Gegenstandes (z.B. in 
einem Behälter) befindet, hilfreich sein, wenn es gilt diesen ersten Gegen- 
stand aufzufinden. Dies könnte in einer Situation auftreten, in welcher zu- 
nächst Repräsentanten für beide Gegenstände im Weltmodell enthalten sind 
und der erste Gegenstand zu einem gewissen Zeitpunkt in den anderen Ge- 
genstand gestellt wird. Dabei wird eine entsprechende „befindet sich in, Re- 
lation erzeugt. Wird nun der erste Gegenstand über eine gewisse Zeitspan- 
ne nicht mehr wahrgenommen, weil beispielsweise der zweite Gegenstand 
nicht eingesehen werden kann, wird der entsprechende Repräsentant aus 
dem Weltmodell entfernt. Bleibt die erstellte Relation durch Archivierung 
erhalten, so kann diese nun zum Auffinden des ersten Gegenstandes genutzt 
werden, beispielsweise wenn ein Nutzer nach diesem verlangt. Dieses Auf- 
finden kann in der dargestellten Situation auch durch die Archivierung des 
Repräsentanten für den ersten Gegenstand, samt seiner zuletzt bekannten 
Position, gelöst werden. Allerdings stellt die archivierte Relation in diesem 
Fall eine Information mit höherem Nutzwert dar. 
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Dieses Beispiel illustriert weiterhin, dass es ebenfalls ein gewinnbringender 
Ansatz sein kann, Relationen erst dann aus dem Weltmodell zu entfernen, 
wenn keiner der beteiligten Repräsentanten mehr im Weltmodell vorhan- 
den ist. Diesem Prinzip folgend ist das Auffinden des ersten Gegenstandes 
aus obigem Beispiel ebenfalls unkompliziert möglich. Die Archivierung von 
Relationen in der Zustandshistorie erlaubt es ebenfalls, aus den bisher aufge- 
tretenen Relationen zu lernen. Dabei können z. B. häufig für Repräsentanten 
eines bestimmten Typs auftretende Relationen als Vorwissen in die entspre- 
chenden Konzeptklassen übernommen werden. 


Qualitätsprüfungen für Relationen 


Als letzten Punkt der Verwaltung von Relationen müssen diese wie Reprä- 
sentanten auch Qualitätsprüfungen unterzogen werden. Abgesehen von 
Aktualitätsprüfungen lassen sich dabei dieselben Arten von Prüfungen 
wie bei Repräsentanten anwenden. Die Ansätze für Relevanz- und Gültig- 
keitsprüfungen können dabei direkt auf Relationen übertragen werden. Für 
Konsistenzprüfungen, durch welche semantisch ungültige Konfigurationen 
im Weltmodell verhindert werden sollen, lassen sich einige für Relatio- 
nen spezifische Erweiterungen einführen. In den Relationskonzepten im 
Hintergrundwissen können dabei Eigenschaften der modellierten Beziehun- 
gen hinterlegt werden wie Symmetrie, Anti-Symmetrie, Transitivität oder 
Anti-Transitivität. Dass diese Eigenschaften auch durch die im Weltmodell 
enthaltenen Relationen zwischen Repräsentanten erfüllt werden, kann dann 
durch entsprechende Konsistenzprüfungen sichergestellt werden. 


Für antisymmetrische Beziehungen kann z. B. sichergestellt werden, dass im 
Weltmodell nicht mehrere Relationen desselben Typs über derselben Menge 
von Repräsentanten existieren. Dies gilt analog für antitransitive Relationen. 
Für transitive Relationen könnte weiterhin umgesetzt werden, dass implizi- 
te, sich aus der Transitivität der Beziehung ergebende Relationen zwischen 
Repräsentanten auch explizit im Weltmodell enthalten sind. 
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5.3.5 Zeitlicher Ablauf 


Die in diesem Abschnitt dargestellte Informationsverwaltung des objekt- 
orientierten Umweltmodells umfasst zahlreiche, teils voneinander abhängi- 
ge Aufgaben. An dieser Stelle soll zusammenfassend ein möglicher zeitli- 
cher Ablauf der Operationen der Informationsverwaltung dargelegt werden, 
der zum Vorgehen in dieser Arbeit passt. Dieser zeitliche Ablauf stellt eine 
Detaillierung des in Abschnitt 5.1.1 überblicksweise dargestellten Verarbei- 
tungsschemas dar. Im Speziellen werden dabei Aspekte der Datenassoziation 
und der Verwaltung von Relationen in das bisherige Verarbeitungsschema 
integriert. Folgende Operationen werden dabei in einem Zeitschritt tą nach- 
einander ausgeführt: 


« Zeitliche Fortschreibung der Repräsentanten (inklusive der Entitäts- 
hypothese rg) auf den aktuellen Zeitschritt t, 


« Bei Vorliegen einer Beobachtung f, für den aktuellen Zeitschritt: 
— Berechnung der Datenassoziationsverteilung dg 


— Anteilige Aktualisierung der Repräsentanten (inklusive Entitäts- 
hypothese) auf Basis der berechneten Assoziationsverteilung 


— Gegebenenfalls: Aufwerten der Entitätshypothese zum Reprä- 
sentant im Weltmodell und Initialisierung neuer Entitätshypo- 
these 


« Entfernen von nicht mehr als relevant betrachteten Repräsentanten 
aus dem Weltmodell 


« Durchführung von Qualitätsprüfungen für Repräsentanten, welche 
keine Informationen über deren Klassenzugehörigkeit benötigen (z. B. 
Gültigkeitsprüfungen, Aktualitätsprüfungen) 


« Klassifizierung von Repräsentanten (Berechnung der Repräsentant- 
zu-Konzept Zuordnung) 


« Durchführung von Qualitätsprüfungen für Repräsentanten mit Wis- 
sen über Klassenzugehörigkeit (z. B. Konsistenzprüfungen, Relevanz- 
prüfungen) 
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« Entfernen von Relationen, welche aktuell nicht mehr im Weltmodell 
enthaltene Repräsentanten betreffen 


e Aktualisierung der existierenden Relationen (z.B. durch Neuberech- 
nung) auf Basis der aktualisierten Repräsentanten 


— Gegebenenfalls: Entfernen nicht mehr relevanter Relationen 


« Erzeugen neuer Relationen: Prüfung, ob für geänderte oder neu auf- 
genommene Repräsentanten weitere Relationen vorliegen 


« Durchführung von Qualitätsprüfungen für Relationen 


Der dargestellte Ablauf stellt dabei zunächst sicher, dass eine minima- 
le Menge von als relevant betrachteten aktualisierten, konsistenten und 
formal gültigen Repräsentanten im Weltmodell enthalten ist, bevor die 
auf dieser Menge von Repräsentanten basierenden Relationen betrachtet 
werden. Dieser Ablauf wird prinzipiell in jedem Zeitschritt wiederholt. 
Im Rahmen von Laufzeitoptimierungen können einzelne Schritte nur zu 
bestimmten Zeitpunkten durchgeführt werden, wie bereits in Abschnitt 
5.1.1 erläutert. Zu diesen einzelnen Schritten zählen auch die Verarbei- 
tungsoperationen der adaptiven Umweltmodellierung, welche in späteren 
Kapiteln vorgestellt werden. Nachfolgend soll zunächst näher auf das The- 
ma des Entfernens von Informationen aus dem Weltmodell eingegangen 
werden. Dies betrifft Fragestellungen wie wann das Archivieren von zu 
entfernenden Informationen nützlich sein kann, vor allem in Bezug auf das 
Lernen von Erfahrungswerten. 


5.4 Speicherung von 
Erfahrungsinformationen 


Mit Weltmodell und Hintergrundwissen besitzt das objektorientierte Um- 
weltmodell zwei Komponenten, welche es einem kognitiven System erlau- 
ben, aktuelle Informationen und Wissen bei Bedarf abzurufen sowie für eine 
spätere Verwendung persistent abzulegen. Im Hintergrundwissen wird da- 
bei allgemeines Vorwissen gespeichert, welches statische Eigenschaften der 
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relevanten Umgebung sowie der auszuführenden Aufgabenstellungen be- 
trifft. Das Weltmodell repräsentiert dagegen zu jedem Zeitpunkt den aktu- 
ellen Zustand der beobachteten Umgebung. Veränderungen an diesem Zu- 
stand, und somit die Dynamik der betrachteten Umgebung, werden durch 
die Speicherung vergangener Zustände mit dem jeweiligen Zeitbezug in ei- 
ner Zustandshistorie realisiert [Ghe08]. Diese Zustandshistorie ermöglicht 
dabei einerseits die Behandlung von Aufgaben, welche Informationen aus 
verschiedenen Zeitabschnitten benötigen [Ghe08], und stellt andererseits 
ein Protokoll der erworbenen Informationen dar. Diese Informationen lie- 
gen in der Zustandshistorie jedoch zunächst in roher, unaufbereiteter Form 
vor. Aus der Zustandshistorie können jedoch die als wertvoll angesehenen 
Informationen extrahiert und unter Verwendung entsprechender Lernpro- 
zesse zu neuem domänen- und aufgabenspezifischen Erfahrungswissen auf- 
bereitet werden [Ghe10a]. 


Auf ein Vorgehen zum Erwerb von klassenbezogenem Hintergrundwissen 
für bisher nicht modellierte Entitätstypen wird im Kapitel 8 mit Bezug zur 
adaptiven Umweltmodellierung eingegangen. In diesem Abschnitt sollen zu- 
nächst Möglichkeiten vorgestellt und erörtert werden, wie sich ein kogniti- 
ves System durch Erwerb von Erfahrungswissen an seine Umgebung anpas- 
sen und sich bei der Durchführung der ihm auferlegten Aufgaben verbes- 
sern kann. In vorausgehenden Abschnitten wurde bereits im Rahmen der 
Verwaltung von Repräsentanten und Relationen die Möglichkeit angespro- 
chen, erworbenes Erfahrungswissen über relevante Entitäten für eine län- 
gerfristige Aufbewahrung vorzusehen, beispielsweise durch Archivierung 
oder Integration ins Hintergrundwissen des Umweltmodells. Diese Möglich- 
keiten sollen an dieser Stelle durch eigene Ideen vertieft und strukturiert dis- 
kutiert werden, unter Einbeziehung und Zusammenfassung der Aussagen 
von Vorarbeiten zur objektorientierten Umweltmodellierung. Die Struktu- 
rierung soll dabei anhand der Art der erworbenen Erfahrungsinformationen 
und den damit verbundenen Möglichkeiten und Orten zur Speicherung von 
Informationen stattfinden. Es sei angemerkt, dass im Rahmen dieser Arbeit 
keine Evaluierung der hier vorgestellten Überlegungen durchgeführt wurde. 
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Arten von Erfahrungsinformationen und ihre Speicherorte 


Die Repräsentation des Umgebungszustandes im Weltmodell unterliegt wie 
bereits erwähnt einer Anforderung zur Schlankhaltung. Umgesetzt wird die- 
se Anforderung durch das Entfernen von nicht mehr relevanten Repräsen- 
tanten und Relationen aus dem Weltmodell. Weiterhin wird im Weltmo- 
dell der Zustand zum aktuellen Zeitpunkt repräsentiert, die zeitliche Ent- 
wicklung dieses Zustands dagegen wird in der Zustandshistorie dargestellt. 
Diese Zustandshistorie ist dabei Sammelbecken sämtlicher über die Umge- 
bung erworbener Informationen und daher Ausgangspunkt für die Selek- 
tion und Extraktion relevanten Erfahrungswissens. Als Senke solches auf- 
bereiteten Wissens bietet sich das Hintergrundwissen an. Hier können ei- 
nerseits existierende Konzepte um domänenspezifisches Erfahrungswissen 
ergänzt oder durch Unterklassenbildung spezialisiert werden. Andererseits 
kann hier auch Wissen über einzelne, herausragende Entitäten in Form der 
bereits erwähnten prioren Instanzen abgelegt werden. 


Speicherorte Zusätzlich zu Weltmodell, Zustandshistorie und Hintergrund- 
wissen bietet sich die Nutzung eines Kurzzeitspeichers als Speicherort für 
aktuelle Erfahrungsinformationen an. Dieser Kurzzeitspeicher betrifft Infor- 
mationen, welche zwar aus dem Weltmodell entfernt wurden, in der näheren 
Zukunft aber mit einer gewissen Wahrscheinlichkeit wieder relevant wer- 
den können. Werden derartige Informationen in einem Kurzzeitspeicher ab- 
gelegt, so können diese bei Bedarf schnell wieder zugegriffen werden. So- 
mit lässt sich insgesamt eine Art Speicherhierarchie für Zustandsinforma- 
tionen umsetzen: an der Spitze steht das Weltmodell mit zeitaktuellen In- 
formationen, gefolgt von einem Kurzzeitspeicher für potentiell in der na- 
hen Zukunft relevante Informationen. Ergänzt wird die Hierarchie durch die 
Zustandshistorie, welche alle bisher über die Umgebung erworbenen Infor- 
mationen in Form eines Protokolls ungefiltert und unaufbereitet darstellt. 
Vervollständigt wird die Hierarchie schließlich durch das Hintergrundwis- 
sen, welches das über einen aktuellen Anwendungsfall hinaus gültige Er- 
fahrungswissen persistiert. Zustandshistorie, Kurzzeitspeicher und Hinter- 
grundwissen übernehmen dabei die Funktion der Archivierung relevanter 
erworbener Informationen, welche aus dem Weltmodell entfernt wurden. 
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Passend zu diesen unterschiedlichen Arten von Informationsspeichern las- 
sen sich auch Arten besonders relevanter Erfahrungsinformationen iden- 
tifizieren. 


Einzigartige Entitäten Eine besonders relevante Art von Entität stellen 
dabei solche Entitäten dar, welche in der betrachteten Umgebung als ein- 
zigartig anzusehen sind. Dies betrifft Entitäten, welche klar unterscheidbare 
Instanzen eines i. A. umfassenden Entitätstyps sind und die weiterhin eine 
hohe Relevanz für den aktuellen Anwendungsfall besitzen, indem sie bei- 
spielsweise häufig für Aufgaben benötigt werden. Da der Entitätstyp um- 
fassend ist, wird seine Modellierung als Konzept im Hintergrundwissen oft 
nicht die Angabe von sehr spezifischen Attributen erlauben. Die beobachte- 
ten Attributwerte einer der Instanzen dieses Typs stellen somit eine wertvol- 
le Spezialisierung dar. Als Beispiele solcher Entitäten lassen sich menschli- 
che Nutzer oder beobachtete Personen zusammen mit z.B. ihren Vorlieben 
und Gewohnheiten nennen. Weiterhin fallen auch Entitäten in diese Katego- 
rie, welche als die einzigen in einer betrachteten Umgebung auftretenden In- 
stanzen eines Konzepts gelten können. Hier lassen sich als Beispiele aus der 
Haushaltsdomäne ein Kühlschrank oder ein Küchentisch nennen, welche in 
der Regel nur einmal als Objekt in einer Küche auftreten. Einmal erworbe- 
ne konkrete Informationen über solche Entitäten besitzen ebenfalls einen 
hohen Nutzwert für ein kognitives System. Die objektorientierte Umwelt- 
modellierung behandelt solche Entitäten als sog. prioren Instanzen’ [Bel09, 
Ghe10a]. Diese werden zur Laufzeit des Systems im Weltmodell vorgehalten 
und können initial aus dem Hintergrundwissen geladen werden. Zur lang- 
fristigen Persistierung können Änderungen an prioren Instanzen wieder ins 
Hintergrundwissen zurückgespielt werden. Priore Instanzen sind weiterhin 
gute Kandidaten, um im vorgeschlagenen Kurzzeitspeicher vorgehalten zu 
werden. Dies betrifft z.B. den Fall, dass ein Kontextwechsel im kognitiven 
System erfolgt, welcher in der Zukunft auch wieder rückgängig gemacht 
werden könnte - wie z.B. das Wechseln in einen anderen Raum in einer 
Haushaltsumgebung. 


* Englisch: prior records [Bel09] 
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Stellvertreter-Entitäten Weiterhin kann es in einer Domäne Entitäten ge- 
ben, die zwar nicht die einzigen Instanzen einer Klasse sind, die aber den- 
noch eine ausgezeichnete Position einnehmen, in Form einer Art Stellver- 
treterfunktion für ihr Konzept. Beispiele aus der Haushaltsdomäne sind ver- 
derbliche Verbrauchsgegenstände, die nach ihrer Öffnung nicht instantan, 
sondern erst allmählich verbraucht werden - wie eine Packung Milch, eine 
Flasche Saft oder eine Packung Müsli. Spricht der Mensch von solchen Ob- 
jekten oft auch nur unspezifisch, so ist meistens dennoch eine ganz bestimm- 
te Instanz gemeint. Vorgehaltene Informationen über solch ausgezeichnete 
Instanzen sind meistens bzgl. zustandsbezogener Attribute relevant, wie die 
letzte bekannte Position einer Instanz, ihr Alter oder der Anteil ihres bereits 
verbrauchten Inhalts. Daher lohnt es sich auch hier für ein kognitives Sys- 
tem, erworbene Informationen zu solchen Instanzen zumindest mittelfristig 
vorzuhalten. Aufgrund ihrer zustandsbehafteten Natur ist eine langfristige 
Speicherung im Hintergrundwissen nicht notwendigerweise zweckdienlich. 
Hier bietet sich dagegen wieder der Kurzzeitspeicher als Speicherort an. Für 
welche Typen von Entitäten eine derartige Vorhaltung im Kurzzeitspeicher 
sinnvoll ist, hängt im Allgemeinen von den Aufgaben des kognitiven Sys- 
tems ab und kann, wie in Abschnitt 5.3.2 beschrieben, bereits a priori über 
Konzepte festgelegt werden. 


Instanzen domänenspezifischer Unterklassen Ähnlich zu einzigartigen 
Entitäten stellen auch Instanzen domänenspezifischer Unterklassen Entitä- 
ten dar, welche im Hintergrundwissen bereits über ein allgemeiner gehal- 
tenes Konzept beschrieben werden. Im Gegensatz zu einzigartigen Entitä- 
ten können zu diesen Konzepten in einer Anwendung allerdings mehrere 
Instanzen gleichzeitig existieren. Als Beispiele für solche Konzepte aus der 
Haushaltsdomäne lassen sich Gebrauchsgegenstände wie Tafelbesteck oder 
Geschirr nennen. Im Hintergrundwissen mag z.B. ein allgemeines Konzept 
für Tafelmesser modelliert sein. In einer Küchenumgebung können unter- 
schiedliche Instanzen dieses Konzepts beobachtet werden. Für diese konkret 
beobachteten Instanzen kann nun eine wesentlich spezifischere Modellie- 
rung möglich sein, z. B. in Bezug auf ihre Form, Größe und Farbe, als im all- 
gemeinen Konzept. Um solches, ebenfalls wertvolles Erfahrungswissen spei- 
chern zu können, besteht eine Möglichkeit darin, das allgemeinere Konzept 
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im Hintergrundwissen um eine spezialisierte Unterklasse zu ergänzen. Diese 
Unterklasse kann dann die spezifisch ausgepragten Eigenschaften beobach- 
teter Instanzen durch konkretisierte Attributverteilungen beschreiben. Die 
Erzeugungen solcher Unterklassen lasst sich mit den Mitteln der in Kapitel 
8 beschriebenen adaptiven Wissensverwaltung umsetzen. 


Typbezogenes Zusatzwissen Neben der Erzeugung neuer Unterklassen 
kann domänenspezifisches Erfahrungswissen auch in Form einer Ergänzung 
existierender Konzepte gespeichert werden. Dies betrifft z. B. Informationen 
wie den in einer Umgebung üblichen Aufbewahrungsort von Gegenständen, 
in einem Haushaltsszenario beispielsweise den Aufbewahrungsort von Ge- 
schirrteilen wie Tassen und Tellern oder Verbrauchsgütern wie Obst. Auch 
die maximal verfügbare Anzahl von Gegenständen, wie beispielsweise Ge- 
schirrteilen, kann nützliches Erfahrungswissen darstellen und als typbezo- 
genes Zusatzwissen im entsprechenden Konzept gespeichert werden. 


Funktionen eines Kurzzeitspeichers Der vorgeschlagene Kurzzeitspei- 
cher kann genutzt werden, wenn als Ergebnis der Datenassoziation für ei- 
ne gegebene Beobachtung ein neuer Repräsentant zu erzeugen ist. In die- 
sem Fall können nun die Beobachtungswerte zunächst mit den im Kurz- 
zeitspeicher vorgehaltenen Repräsentanten verglichen werden. Bei Überein- 
stimmung kann der entsprechende Repräsentanten mitsamt seinen bisheri- 
gen Attributen reaktiviert, d.h. wieder ins Weltmodell aufgenommen, und 
anhand der gegebenen Beobachtung aktualisiert werden. Somit lassen sich 
bereits erworbene Erfahrungsinformationen, welche zwischenzeitlich ent- 
fernt und archiviert wurden, wiederverwenden. Der Vergleich zwischen Be- 
obachtung und archivierten Repräsentanten im Kurzzeitspeicher kann mit- 
tels der normalen Datenassoziation erfolgen. Weiterhin lässt sich der Inhalt 
des Kurzzeitspeichers auch für andere, auf Effizienz optimierte Verarbei- 
tungsoperationen nutzen, wie beispielsweise die Beantwortung von Nutzer- 
anfragen nach dem Aufenthaltsort von Entitäten. Wurden diese bereits aus 
dem Weltmodell entfernt, erlaubt auch hier der Kurzzeitspeicher einen ge- 
genüber der Zustandshistorie verkürzten Zugriff. 


Ähnliches gilt auch für Relationen. Auch diese können zur Beschleunigung 
des Zugriffs nach Entfernung aus dem Weltmodell in den Kurzzeitspeicher 
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aufgenommen werden. Dies ist vor allem dann sinnvoll, wenn Relationen 
aufgrund eines nicht mehr im Weltmodell existierenden Repräsentanten ent- 
fernt werden. In diesem Fall kann der entsprechende Repräsentant zugleich 
in den Kurzzeitspeicher aufgenommen werden. 


Verarbeitung von prioren Instanzen 


Priore Instanzen erlauben es, Vorwissen über bestimmte Entitäten, im Ge- 
gensatz zu Vorwissen über Entitätstypen, in das objektorientierte Umwelt- 
modell einzubringen. Dieses instanzbasierte Vorwissen kann dabei ebenfalls 
a priori von menschlichen Experten modelliert werden [Bel09]. Dem kogniti- 
ven System wird somit die Möglichkeit gegeben, bei Beobachtung bestimm- 
ter Entitäten direkt über eine Menge von vorab definierten, größtenteils se- 
mantischen Informationen zu verfügen [Ghe10a]. Weiterhin kann es mög- 
lich sein, perzeptive Attribute in prioren Instanzen umfassender und präziser 
zu modellieren als es durch die Verwendung der Sensoren eines kognitiven 
Systems möglich sein könnte. Priore Instanzen ermöglichen in diesem Fall 
eine Präzisierung und Detaillierung von Attributen auf Basis von Vorwissen 
[Ghe10b, Bel12b]. 


Für die Verwendung von prioren Instanzen ist es eine wichtige Fragestel- 
lung, wie die im Hintergrundwissen modellierten prioren Instanzen mit be- 
obachteten Entitäten in Verbindung gebracht werden können. Hier kön- 
nen unterschiedliche Situationen vorliegen. Eine Möglichkeit ist, dass prio- 
re Instanzen z. B. nicht manuell von Domänenexperten erstellt wurden, son- 
dern zu einem früheren Zeitpunkt als Repräsentanten im Weltmodell erzeugt 
und anschließend ins Hintergrundwissen übertragen wurden. In diesem Fall 
kann der zuvor beschriebene Mechanismus zur Datenassoziation genutzt 
werden. Durch die Datenassoziation kann eine Entitätsbeobachtung einer 
prioren Instanz zugeordnet werden, falls priore Instanzen zusammen mit 
den Repräsentanten des Weltmodells durch die Datenassoziation als mögli- 
che Zuordnungsziele betrachtet werden. Wurde eine priore Instanz manuell 
modelliert, so kann ebenfalls der Mechanismus zur Datenassoziation genutzt 
werden, falls die priore Instanz mit ausreichend diskriminativen perzeptiven 
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Attributen modelliert wurde. Sollen nicht Entitätsbeobachtungen mit prio- 
ren Instanzen in Verbindung gebracht werden, sondern deren Weiterverar- 
beitung in Form eines Repräsentanten des Weltmodells, so kann hierfür die 
in Kapitel 6 beschriebene Repräsentant-zu-Konzept Zuordnung verwendet 
werden. Weiterhin kann eine priore Instanz auch immer durch einen Be- 
nutzer einer Beobachtung bzw. einem Repräsentanten zugeordnet werden, 
z.B. mittels eines eindeutigen Identifikators wie einem Namen. Eine solche 
Zuordnung könnte z.B. über Sprachbefehle erfolgen. 


Über die hergestellte Zuordnung zwischen einem Repräsentanten und einer 
prioren Instanz können auch die perzeptiven Attribute der prioren Instanz 
aktualisiert werden. Sinkt die Existenzwahrscheinlichkeit des Repräsentan- 
ten unter die Schwelle y,, wird die Verbindung zur prioren Instanz getrennt 
und der Repräsentant aus dem Weltmodell entfernt. Sollen Entitäten eines 
bestimmten Typs immer als priore Instanzen im Hintergrundwissen persis- 
tiert werden (z.B. singuläre Instanzen), so kann diese Eigenschaft im Kon- 
zept für den entsprechenden Entitätstyp bereits a priori annotiert werden. 
Zu diesem Zweck müsste die Kern-Ontologie des objektorientierten Um- 
weltmodells entsprechend erweitert werden, um eine derartige Annotation 
von Konzepten im Hintergrundwissen darstellen zu können. 


Lernen aus Erfahrungswerten 


Neben der längerfristigen Speicherung wichtiger Entitäten ist auch die Ver- 
arbeitung und Analyse der in der Zustandshistorie gespeicherten Informa- 
tionen ein wichtiger Schritt bei der Generierung und Speicherung von Er- 
fahrungswissen. Ein wesentliches Ziel ist dabei, das bisherige Hintergrund- 
wissen im objektorientierten Umweltmodell durch domänenspezifische In- 
formationen zu ergänzen und zu spezialisieren. Auf Basis von in der Umge- 
bung beobachteten Instanzen lassen sich die entsprechenden Konzepte im 
Hintergrundwissen um zusätzliche Attribute ergänzen oder durch neue Un- 
terklassen spezialisieren. 
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Solches zusatzliches Erfahrungswissen bietet den Vorteil, sowohl die Infor- 
mationsverarbeitung im Umweltmodell als auch die Bereitstellung von In- 
formationen durch das Umweltmodell in Bezug auf die Aufgaben des kogni- 
tiven Systems verbessern und optimieren zu können. Die Erweiterung von 
Konzepten um domänenspezifische deduktive Attribute ermöglicht es bei- 
spielsweise, statistisches Wissen über die beobachtete Umgebung zu persis- 
tieren. Ein Beispiel solchen Wissens ist der wahrscheinlichste Aufenthaltsort 
von Instanzen eines Konzepts, wie ein Aufbewahrungsort für Gegenstände. 
Weiterhin können für Entitätstypen Präferenzen gelernt und als deduktive 
Attribute in Konzepten gespeichert werden, z. B. in Bezug auf auszuführende 
Handlungen für Gegenstände, welche prinzipiell mehrere Alternativen er- 
lauben (in der Haushaltsdomäne z. B., für welche Geschirranteile ein Mensch 
eine Reinigung durch die Spülmaschine erlaubt und für welche nicht). Dar- 
über hinaus ermöglicht die Erzeugung domänenspezifischer Unterklassen 
weitere Verbesserungen, basierend auf präziser definierten Konzepten. Bei- 
spielsweise kann die Genauigkeit der Repräsentant-zu-Konzept Zuordnung 
verbessert werden, wenn die Attribute von allgemeiner definierten Konzep- 
te basierend auf den bisherigen Beobachtungen der Umgebung spezialisiert 
werden können in einer entsprechenden Unterklasse. 


Um neues Erfahrungswissens für Konzepte zu lernen, werden in der Zu- 
standshistorie alle Repräsentanten betrachtet, welche Instanzen der entspre- 
chenden Konzepte darstellen. Durch Analyse der Attributverteilungen die- 
ser Repräsentanten im Vergleich zu den im Konzept modellierten Attributen 
lässt sich dann neues, domänenspezifisches Erfahrungswissen identifizieren 
und extrahieren. Ein mögliches Vorgehen zum Lernen aus Erfahrungswerten 
für Konzepte wird im Kapitel 8 beschrieben. Die Integration neuen Wissens 
sollte dabei immer mit Bedacht erfolgen und z. B. auf Prinzipien wie der Re- 
levanz des Wissens begründet sein. 
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Speicherung der Zustandshistorie 


Die Speicherung der Zustandshistorie kann optimiert erfolgen, indem nur 
diejenigen Attribute in einem Zeitschritt kg + T abgespeichert werden, wel- 
che sich im Vergleich zu ihren Werten in einem Basiszeitschritt kg geändert 
haben. Eine Möglichkeit, eine solche Speicherung effizient auszuführen, be- 
steht in der Verwendung von auf dem Markt erhältlichen Datenbanksys- 
temen. Als Voraussetzung hierfür müssen die zu persistierenden Informa- 
tionen, d.h. die Attribute der Repräsentanten bzw. die Relationen im Welt- 
modell, in ein vom Datenbanksystem unterstütztes Format konvertiert wer- 
den. Eine solche Konvertierung kann automatisiert ausgeführt werden. Die 
semantische Interoperabilität der Konvertierung wird dabei durch das in 
Abschnitt 4.3 definierte Metamodell unterstützt. Da sich die Entitäten un- 
terschiedlichen Typs sowie die unterschiedlichen Relationen darin unter- 
scheiden können, welche Attribute sie besitzen, bietet sich eine schemafreie 
Repräsentation der zu persistierenden Informationen an. Zu diesem Zweck 
kann z.B. das JSON’ [Bra17] Format genutzt werden, um Repräsentanten 
und Relationen jeweils als sog. Dokumente zu repräsentieren. Solche Doku- 
mente können anschließend in einer dokumentenorientierten Datenbank? 
gespeichert und bei Bedarf wieder abgerufen werden. Nachfolgend wird die- 
ser Ansatz beispielhaft dargestellt. 


Beispiel 9 (Persistierung eines Repräsentanten als JSON in ko). Sei ein Re- 
präsentantr; gegeben, welcher beispielhaft über zwei deskriptive Attribute ver- 
fügt: ein Attribut für das ordinale Merkmal Farbe und eines für das verhält- 
nisskalierte Attribut Länge. Weiterhin seien eine Existenzvariable sowie eine 
Typvariable als spezielle Attribute gegeben, sowie ein Zeitstempel. Dann ergibt 


JavaScript Object Notation 
* Beispiele solcher Datenbanken sind: CouchDB, MongoDB. 
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sich in JSON die Darstellung des Repräsentanten als das Dokument 


Pry" F {"timestep "> kọ, 


"existence" : 0.9, 


"color":  [0, 0.2, 0.4, 0.25, 0.15, 0], 
"length oe Ee :0.2,"c" : 0.01,"Einheit" : "Meter "}, 
"type": {"Gabel" : 0.985, 

"Löffel" : 0.012, 


"Messer" : 0.003 } 


} 


in welchem die Werte aller deskriptiven Attribute sowie des Existenz- und 
Typattributs persistiert sind. Für die Wertebereiche von qualitativen Attri- 
buten wird dabei eine festgelegte Ordnung der Symbole angenommen. Das 
Typattribut wird dagegen als eine Liste von Werten dargestellt. 


Beispiel 10 (Optimierte Speicherung als JSON im Zeitschritt kg + T). 

Sei im Zeitschritt ko +t derselbe Repräsentant r; mit geänderten Werten seines 
Existenz-Attributs und seiner Typzuordnung gegeben. Der geänderte Repräsen- 
tant lässt sich dann in komprimierter Darstellung als reine Änderung gegenüber 
dem Basiszeitschritt ko in JSON darstellen als 


{"r" 1 {"timestep" : ky +T, 
"existence" : 0.875, 

"type" : {"Gabel "+ 0.99, 

"Löffel" : 0.01} 


I 


Unveränderte Attribute müssen somit nicht erneut gespeichert werden. 
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5.5 Weiterführende Aspekte der 
Informationsverwaltung 


In diesem Kapitel wurden grundlegende Verfahren der probabilistischen In- 
formationsverwaltung in der objektorientierten Umweltmodellierung dar- 
gelegt. Nicht detailliert eingegangen wurde auf den Aspekt der Zuordnung 
von Repräsentanten zu Konzepten des Hintergrundwissens. Dieser Aspekt 
wird nachfolgend in Kapitel 6 betrachtet. 


Weiterführende Aspekte der Informationsverwaltung im objektorientierten 
Umweltmodell werden in den Arbeiten von Belkin [Bel17] beschrieben. Dies 
betrifft z.B. die Erkennung von Situationen in der beobachteten Umgebung 
auf Basis des repräsentierten Umgebungszustandes [Bel12a]. Dabei wird u.a. 
mittels einer quantitativen Analyse bewertet, ob die im Weltmodell vorlie- 
genden Informationen ausreichend spezifisch bzgl. einer Situation sind. Da- 
zu wird ein sog. Bestimmtheitswert berechnet. Dieser kann verwendet wer- 
den, um den aktiven Erwerb zusätzlicher Informationen in Bezug auf die 
betrachtete Situation auszulösen. 


5.6 Zusammenfassung 


In diesem Kapitel wurde die Verwaltung von erworbenen Umgebungsinfor- 
mationen in der objektorientierten Umweltmodellierung vorgestellt. Einen 
wichtigen Anteil nimmt dabei die probabilistische Informationsverarbeitung 
des Weltmodells ein. Auch für die adaptive Umweltmodellierung stellt die- 
se Informationsverarbeitung eine wichtige Grundlage dar. Daher wurden 
in diesem Kapitel die wichtigsten Ansätze aus Vorarbeiten zum objektori- 
entierten Umweltmodell bzgl. der probabilistischen Informationsverarbei- 
tung dargelegt. Diese betreffen u. a. die Datenassoziation, die Erzeugung und 
Aktualisierung von Repräsentanten sowie Qualitätsprüfungen. Als Beiträge 
dieser Arbeit zur probabilistischen Informationsverarbeitung wurden diese 
existierenden Ansätze dabei an einigen Stellen ergänzt und erweitert. Dies 
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betrifft z.B. die Datenassoziation sowie die Erzeugung neuer Repräsentan- 
ten. Weiterhin wurden in diesem Kapitel als Beiträge der Arbeit Themen auf 
konzeptioneller Ebene betrachtet. Dies betrifft die Verwaltung von probabi- 
listischen Relationen, einen erweiterten zeitlichen Ablauf für die Informati- 
onsverwaltung sowie das Speichern und Verwenden von Erfahrungswerten 
in der Umweltmodellierung. 


Auch wurde in diesem Kapitel eine formale Notation zur Beschreibung des 
objektorientierten Umweltmodells und seiner Inhalte festgelegt. Diese No- 
tation wird in den nachfolgenden Kapiteln fortgeführt und erweitert, z.B. in 
Bezug auf die Repräsentant-zu-Konzept Zuordnung. 
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Repräsentant-zu-Konzept 
Zuordnung 


In diesem Kapitel wird die Zuordnung von Repräsentanten zu Konzepten be- 
handelt. Diese Zuordnung spielt sowohl in der Informationsverwaltung als 
auch in der in den Kapiteln 7 und 8 beschriebenen adaptiven Umweltmodel- 
lierung eine wichtige Rolle. Die Repräsentant-zu-Konzept Zuordnung wird 
in Abschnitt 6.1 zunächst allgemein vorgestellt, zusammen mit der Darstel- 
lung eines existierenden Ansatzes in Abschnitt 6.1.2. Die Abschnitte 6.2 und 
6.3 beschreiben dann den Beitrag dieser Arbeit, welcher aus einem alterna- 
tiven Ansatz der Zuordnung mit gewissen, für den Einsatz in der adapti- 
ven Umweltmodellierung wünschenswerten Eigenschaften besteht. In Ab- 
schnitt 6.4 wird als ein weiterer Beitrag dieser Arbeit eine Erweiterung des 
alternativen Ansatzes vorgestellt. Abschnitt 6.5 fasst das Kapitel schließlich 


zusammen. 


6.1 Einführung und Motivation 


In der objektorientierten Umweltmodellierung stellt das Hintergrundwis- 
sensmodell semantisches Vorwissen bezüglich relevanter Typen von Entitä- 
ten bereit. Unter Verwendung dieses Vorwissens kann der beobachtete Um- 
gebungszustand des Weltmodells um Informationen ergänzt werden, wel- 
che nicht über die genutzten Sensoren bereitgestellt werden können. Reprä- 
sentanten im Weltmodell, welche eine Entität eines Typs darstellen, für den 
im Hintergrundwissen ein entsprechendes Konzept enthalten ist, können so 
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um die zusätzlich im Konzept modellierten Informationen ergänzt werden 
[Bel12b]. 


Die Voraussetzung für das Ergänzen derartiger semantischer Informationen 
ist die erfolgreiche Zuordnung eines Repräsentanten zu einem Konzept im 
Hintergrundwissen. Diese Aufgabe entspricht einer Klassifikation des Re- 
präsentanten. Als Ziele dieser Klassifikation dienen die modellierten Kon- 
zepte des Hintergrundwissens bzw. eine geeignete Teilmenge davon. In der 
objektorientierten Umweltmodellierung erfolgt diese Klassifikation als Teil 
der schritthaltend durchgeführten Informationsverwaltung (vgl. Abschnitt 
5.3.5) und wird als Repräsentant-zu-Konzept Zuordnung bezeichnet. 


6.1.1 Die Repräsentant-zu-Konzept Zuordnung als 
Klassifikationsaufgabe 


Im Allgemeinen kann Klassifikation als das Problem des Einlernens einer 
Funktion y = h(x) beschrieben werden, welche für ein gegebenes Datum 
x als Funktionswert dessen Klasse y zurückgibt [Rus10]. Der Wertebereich 
der Funktion h(-) ist dabei diskret und entspricht den möglichen Klassen, 
welchen das Datum x angehören kann. Die Funktion h(-) wird dabei als 
Hypothese bezeichnet [Rus10] und kann gelernt werden. Im Fall eines über- 
wachten Einlernens werden dazu Trainingsdaten benötigt, d.h. eine Menge 
von Wertepaaren (y,,x;) mit i = 1,...,l, welche die Funktion beispielhaft 
beschreiben. Da bei solchen Lernvorgängen vom Speziellen (Beispielhaften) 
auf das Allgemeine (Modellhafte) geschlossen wird, handelt es sich um ei- 
ne Form der induktiven Inferenz. Besteht zwischen den Daten x; und ihren 
Klassen y; kein streng deterministischer, sondern ein probabilistischer Zu- 
sammenhang, so wird anstelle der Funktion h(-) als Modell eine bedingte 
Wahrscheinlichkeitsverteilung pQ|x) gelernt. 


Verfahren, welche zur Klassifikation im Bereich des überwachten Lernens 
eingesetzt werden können, sind z.B. Entscheidungsbäume und ihre Erwei- 
terungen sowie Support-Vektor-Maschinen (SVM). Bei diesen Verfahren 
können die Daten x; vektorwertige Merkmale darstellen. Weiterhin können 
auch künstliche neuronale Netze zur Klassifikation eingesetzt werden. In 
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deren Fall stellen die Eingabedaten meist Rohdaten dar, welche ohne eine 
vorhergehende Merkmalsextraktion genutzt werden, wie z.B. Bilddaten. 
Entsprechende Merkmale werden dann beim Training eines neuronalen 
Netzes mit eingelernt. 


In der Praxis werden zur Klassifikation von Objekten in verschiedene Klas- 
sen oftmals binäre Klassifikationsverfahren eingesetzt. Diese Verfahren ge- 
ben z.B. den Wert 1 aus, wenn ein gegebenes Objekt zur betrachteten Klasse 
gehört, und anderenfalls den Wert 0. Mehrere trainierte binäre Klassifikato- 
ren können kombiniert werden, um eine Unterscheidung von mehr als zwei 
Klassen zu ermöglichen, im Falle eines sog. Multiklassen-Problems. Die ge- 
lernte Hypothese h(-) eines binären Klassifikators kann als ein Modell für 
die betrachtete Objektklasse verstanden werden. 


Hierarchische Klassifikation 


In der objektorientierten Umweltmodellierung sind die modellierten Kon- 
zepte hierarchisch in einer „is-a“-Generalisierungshierarchie angeordnet. 
Die Repräsentant-zu-Konzept Zuordnung stellt somit formal eine hierar- 
chische Klassifikation dar. Die hierarchische Klassifikation kann als eine 
Erweiterung der allgemeinen Klassifikation verstanden werden. Hierarchi- 
sche Klassifikationsprobleme können dabei nach Silla und Freitas [Sil11, 
Bor13] anhand von drei Kriterien unterschieden werden. Das erste Krite- 
rium betrifft die der Hierarchie zugrunde liegende Struktur. Diese kann 
entweder in Form eines Baums gegeben sein oder allgemeiner als ein 
gerichteter azyklischer Graph (DAG'). Das zweite Kriterium betrifft die 
Frage, ob ein Objekt gleichzeitig mehr als einer Klasse zugeordnet werden 
kann (sog. Multi-Label-Probleme). Das dritte Kriterium betrifft schließlich 
die Frage, ob als Ergebnis einer Klassifikation immer nur Blattknoten der 
Hierarchie genutzt werden können oder ob auch intermediäre Knoten als 
Klassen zulässig sind. Auf ähnliche Weise lassen sich auch die Verfahren, 
die zur Lösung dieser hierarchischen Klassifikationsprobleme eingesetzt 


* Englisch: directed acyclic graph 
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werden, einordnen. Dabei werden zunächst dieselben drei Kriterien ver- 
wendet wie zur Beschreibung der Probleme. Als viertes Kriterium wird für 
Verfahren zusätzlich noch unterschieden, ob es sich beim Klassifikations- 
verfahren um ein flaches, lokales oder globales Verfahren handelt [Bor13]. 
Ein flaches Verfahren ignoriert dabei die hierarchischen Zusammenhänge 
zwischen den Klassen und betrachtet nur die Teilmenge der Blattknoten 
als Klassen. Als flache Verfahren können Standardverfahren zur Klassifika- 
tion wie z.B. SVMs eingesetzt werden. Lokale Verfahren setzen ebenfalls 
auf Standardverfahren auf und nutzen diese für eine von der Wurzel der 
Hierarchie ausgehende Top-Down-Klassifikation. Dabei kann z.B. für je- 
den Knoten der Hierarchie ein binärer Klassifikator trainiert werden oder 
pro Ebene der Hierarchie ein Multiklassen-Klassifikator. Im Allgemeinen 
wird als Ergebnis dieses Top-Down-Vorgehens ein Blattknoten als Klasse 
ausgewählt. Globale Verfahren verwenden dagegen nur einen Klassifikator 
über der ganzen Hierarchie und ermöglichen auch intermediäre Knoten 
als Ergebnis. Globale Verfahren sind dabei meist komplexer als flache oder 
lokale Verfahren [Bor13]. 


Besonderheiten der Repräsentant-zu-Konzept Zuordnung 


Die Zuordnung von Repräsentanten zu Konzepten in der objektorientierten 
Umweltmodellierung stellt eine spezielle Art der Klassifikation dar. Zur Be- 
schreibung der möglichen Klassen dient hierbei eine Menge € C Co von 
im Hintergrundwissen definierten Konzepten. Diese Konzepte sind dabei, 
wie bereits erwähnt, hierarchisch angeordnet. Die zu klassifizierenden Da- 
ten stellen die Repräsentanten r € R des Weltmodells dar. Dabei werden so- 
wohl die zu klassifizierenden Objekte, d.h. die Repräsentanten, als auch die 
Klassen, d.h. die Konzepte, nicht über deterministische Merkmale sondern 
probabilistisch beschrieben. Zur probabilistischen Beschreibung dienen die 
Attribute der Umweltmodellierung. Als weitere Besonderheit wird als Er- 
gebnis formal nicht ein einzelnes Konzept gewünscht, sondern eine diskrete 
Wahrscheinlichkeitsverteilung über der Menge der betrachteten Konzepte. 
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Als Wertebereich der Repräsentant-zu-Konzept Zuordnung wird allgemein 
eine Teilmenge € der im Hintergrundwissen €, modellierten Konzepte ge- 
nutzt. Je nach Ansatz kann diese Teilmenge alle Konzepte des Hintergrund- 
wissens enthalten oder eine echte Teilmenge sein. Die Repräsentanten im 
Weltmodell werden für eine Zuordnung zu Konzepten über ihre Attribute 
beschrieben. Dabei spielen nur die deskriptiven Attribute eine Rolle, d. h. al- 
le perzeptiven Attribute, jedoch nicht Existenz- oder Typ-Attribut. Genauer 
gesagt betrifft dies nur diejenigen deskriptiven Attribute, welche nicht rein 
zustandsbezogen sind. Das Ergebnis einer Zuordnung wird dann im Typ- 
Attribut eines Repräsentanten gespeichert. Das Existenz-Attribut besitzt zu- 
nächst keine Relevanz für die Zuordnung. 


Notation 


Für die formale Beschreibung der Repräsentant-zu-Konzept Zuordnung und 
auch die in nachfolgenden Kapiteln beschriebenen Anteile der adaptiven 
Umweltmodellierung wird die in Kapitel 5 eingeführte Notation erweitert. 
Ein Repräsentant r € R wird dabei über seine deskriptiven Attribute a”! 
für i = 1, ..., n beschrieben. Dies kann entweder in Form der Menge 


Ayala", a2, os ar} (6.1) 


seiner Attribute erfolgen oder geordnet als der in Kapitel 5 eingeführte Vek- 
tor a”. Ein Konzept wird analog z.B. als die Menge 


Ae:=fa®, a2, ., am) 62 


seiner Attribute a“ für j = 1,...,m beschrieben. Dabei werden für Kon- 
zepte in A. ebenfalls nur diejenigen Attribute betrachtet, welche zu den de- 
skriptiven Attributen der Repräsentanten korrespondieren. Die Korrespon- 
denz besteht darin, dass durch die Attribute dieselben Qualitäten repräsen- 
tiert werden. Das Ergebnis einer Repräsentant-zu-Konzept Zuordnung wird 
im Sinne einer probabilistischen Klassifikation als die bedingte Wahrschein- 
lichkeit p(c|r) für einen Repräsentanten r und ein Konzept c dargestellt. 
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6.1.2 Vorarbeiten zur Repräsentant-zu-Konzept 
Zuordnung 


Ein Ansatz zur Repräsentant-zu-Konzept Zuordnung in der objektorien- 
tierten Umweltmodellierung wird von Belkin [Bel17, Bel12b] beschrieben. 
In diesem Ansatz werden alle Konzepte der „is-a“-Hierarchie eines Hinter- 
grundwissensmodells betrachtet. Im Allgemeinen betrifft dies in Domänen- 
modellen alle modellierten Konzepte (jedoch nicht alle Relationen), d.h. es 
gilt: € = Co. Die Klassifikation erfolgt in diesem Ansatz hierarchisch auf 
Basis der „is-a*-Beziehungen der Konzepte. 


Vorgehen 


Für einen gegebenen Repräsentanten wird dabei eine Tiefensuche nach pas- 
senden Konzepten in der „is-a“-Hierarchie durchgeführt. Ein Konzept gilt 
als passend, wenn bei einer Ähnlichkeitsbewertung ein definierter Schwell- 
wert überschritten wird. Gilt dies für mehrere Konzepte in einem Zweig der 
Hierarchie, so wird das spezifischste Konzept des Zweiges gewählt. Dies ist 
das Konzept, welches am Weitesten vom Wurzelknoten der „is-a“-Hierarchie 
entfernt ist. Die Ähnlichkeitsbewertung zwischen Repräsentant und einem 
betrachteten Konzept erfolgt zweistufig. In der ersten Stufe wird die struk- 
turelle Ähnlichkeit bewertet. Dabei wird betrachtet, wie viele der für das 
Konzept definierten Attribute tatsächlich beobachtet wurden, also im Re- 
präsentanten enthalten sind. Zu diesem Zweck werden die jeweiligen Attri- 
butmengen von Repräsentant und Konzept über die Jaccard-Metrik’ vergli- 
chen. Die Jaccard-Metrik setzt dabei die Anzahl der gemeinsamen Attribute 
von Repräsentant und Konzept in Bezug zur (vereinigten) Gesamtanzahl der 
Attribute. In der zweiten Stufe werden die Wahrscheinlichkeitsverteilungen 
der gemeinsamen Attribute betrachtet und verglichen. Für diesen Vergleich 
wird die Kullback-Leibler-Divergenz genutzt. Zur Bewertung der Ähnlich- 
keit des Attributs eines Repräsentanten gegenüber dem korrespondierenden 


1 In [Bel12a] wird diese als Tanimoto Distanz bezeichnet. 


252 


6.1 Einführung und Motivation 


Konzept-Attribut werden deren Verteilungen mittels der Kullback-Leibler- 
Divergenz verglichen. Diese Bewertungen pro Attribut werden dann als ei- 
ne gewichtete Summe zu einer Gesamtbewertung kombiniert, welche das 
Ergebnis der zweiten Stufe darstellt. Schließlich müssen die Ergebnisse aus 
der ersten Stufe, dem strukturellen Vergleich, und aus der zweiten Stufe, 
dem Vergleich der probabilistischen Attribute, noch zum Gesamtergebnis 
kombiniert werden. Dies erfolgt ebenfalls in Form einer gewichteten Sum- 
me. Zuvor werden die beiden Einzelergebnisse jedoch normiert, d.h. auf das 
Intervall [0,1] abgebildet. Weiterhin kann unter Anwendung des Satzes von 
Bayes eine A-priori-Wahrscheinlichkeit für die betrachteten Konzepte in die 
Zuordnung mit einfließen. Für einen Repräsentanten r und ein betrachtetes 
Konzept c ergibt sich nach [Bel17] eine Zuordnung p(c|r) somit als die be- 
dingte Wahrscheinlichkeit 


plelr) ~ P(rle) - pe) 
= (ws: f(ds(r, ©) + wo: fo(do(r,0)))- plc): (63) 


Der Index s bezeichnet dabei den strukturellen Vergleich, wohingegen der 
Index v den Vergleich der probabilistischen Attribute beschreibt. Die Ge- 
wichtung ist durch w, bzw. w, gegeben. Weiterhin beschreiben die Funktio- 
nen d,(-) und d,(-) die genannten Distanzmaße. Die Funktionen f,(-) und 
oC) dienen der Normierung dieser Distanzmaße. 


Eigenschaften des Ansatzes 


Der Ansatz nach [Bel17] zeichnet sich durch einige Besonderheiten aus. Zu- 
nachst betrachtet der Ansatz explizit ein hierarchisches Wissensmodell und 
führt auf diesem eine hierarchische Klassifikation durch. Nach den in [Sil11] 
definierten Kriterien stellt der Ansatz dabei ein Verfahren dar, welches 


e auf einem gerichteten azyklischen Graphen als Struktur der Hierar- 
chie angewendet werden kann, 
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e nicht nur Blattknoten als Ergebnisklassen ausgeben kann, sondern 
auch intermediäre Knoten, 


e als Ergebnis Knoten auf mehr als einem Zweig ausgeben kann und 


e insgesamt ein globales Klassifikationsverfahren darstellt. 


Bei hierarchischen Verfahren können wie beschrieben entweder nur Blatt- 
knoten als Ergebnisse ausgegeben werden oder auch intermediäre Knoten. 
Sind auch intermediäre Knoten zulässig und stellt die betrachtete Hierar- 
chie eine „is-a“ Generalisierungsbeziehung dar, so kann es eine Anforderung 
sein, pro Zweig der Hierarchie nur einen Knoten als Ergebnis auszuwählen. 
Eine solche Anforderung ist auch im Falle der Repräsentant-zu-Konzept Zu- 
ordnung in der objektorientierten Umweltmodellierung vorteilhaft. 


Betroffen ist von diesem Aspekt z.B. das Ableiten von semantischen Infor- 
mationen aus Konzepten. Dieses Ableiten erfolgt anteilig anhand der proba- 
bilistischen Zuordnung von Repräsentanten zu Konzepten. Wäre hier neben 
einem Konzept auch sein Vaterkonzept in einer Zuordnung anteilig enthal- 
ten, so könnte dies zu einer ungewollten Verzerrung der abgeleiteten Anteile 
führen. Dies liegt darin begründet, dass die probabilistischen Attributwerte 
eines Konzepts und seines Vaterkonzepts i. A. Abhängigkeiten besitzen. Ei- 
ne solche Verzerrung kann wiederum zu Problemen bei einer nachgelager- 
ten Weiterverarbeitung der durch Repräsentanten dargestellten Informatio- 
nen führen. Der bisherige Ansatz des Umweltmodells [Bel17] wählt daher 
pro Zweig aus den möglichen Konzepten immer nur dasjenige Konzept aus, 
welches am weitesten von der Wurzel entfernt ist. Die möglichen Konzepte 
sind dabei alle Konzepte, deren nach Gleichung (6.3) berechnete Ähnlichkeit 
einen definierten Schwellwert überschreitet. 


Eine weitere wichtige Eigenschaft des Ansatzes [Bel17] ist es, als Ergebnis 
eine Wahrscheinlichkeitsverteilung zu liefern, definiert über der Menge der 
möglichen, d.h. hinreichend ähnlichen Konzepte. Somit kann der Ansatz 
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auch als ein Multi-Label-Verfahren betrachtet werden, welches zu einem Re- 
präsentanten mehrere mögliche Konzepte ausgibt. Weiterhin sieht der An- 
satz vor, dass auf jeder Ebene der Hierarchie eine sog. Dummy-Klasse ge- 
nutzt werden kann, welche stellvertretend für bisher nicht modellierte Kon- 
zepte steht. Diese Dummy-Klasse kann in der Klassifikation als eine Rück- 
weisungsklasse fungieren. 


Nicht unterschieden werden in [Bel17] die verschiedenen Szenarmodi für 
Attribute. Damit unterscheidet sich der Ansatz auf eine wesentliche Wei- 
se von den im Metamodell und in dieser Arbeit getroffenen Annahmen. 
In dieser Arbeit wird davon ausgegangen, dass mit einer gegebenen Kon- 
figuration von Sensoren in einem kognitiven System auch die beobachtba- 
ren Eigenschaften von Objekten festgelegt werden. Somit bestimmt bereits 
die Systemkonfiguration, welche Qualitäten als perzeptiv gelten. Eine Kon- 
sequenz daraus ist die Annahme, dass für alle beobachteten Objekte i. A. 
die gleichen Qualitäten beobachtet und als Attribute von Repräsentanten 
im Weltmodell dargestellt werden. Zugleich wird davon ausgegangen, dass 
deduktive und semantische Attribute nicht direkt durch Beobachtung der 
Umgebung bestimmt werden können. Dies hat zur Folge, dass der struk- 
turelle Vergleich von Repräsentanten zu Konzepten in der ersten Stufe des 
Ansatzes in [Bell2a] unter den Annahmen in dieser Arbeit keine Aussage- 
kraft bezüglich der Unterscheidung von Konzepten besitzt. Darüber hinaus 
sind im in dieser Arbeit verfolgten Ansatz sogar nur diejenigen perzeptiven 
Attribute für eine Zuordnung aussagekräftig, die keine zustandsbezogenen 
Qualitäten beschreiben. Der Ansatz in [Bel17] unterliegt dagegen anderen 
Annahmen. Beispielsweise werden hier für Repräsentanten auch Attribute 
genutzt, die beziehungsbezogene Informationen darstellen, z. B. welche Teile 
ein Objekt besitzt. Werden solche Attribute verwendet, kann ein strukturel- 
ler Vergleich zu einer Unterscheidung von Konzepten beitragen. Im in dieser 
Arbeit verfolgten Ansatz werden derartige Information dagegen mittels Re- 
lationen dargestellt. 
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6.1.3 Motivation eines Bayes’schen Ansatzes für die 
Repräsentant-zu-Konzept Zuordnung 


Eine Repräsentant-zu-Konzept Zuordnung ist eine wichtige Voraussetzung 
für die adaptive Umweltmodellierung, z. B. in Bezug auf die quantitative Mo- 
dellbewertung oder das Auffinden von Repräsentanten, welche nur schlecht 
von einem Hintergrundwissensmodell beschrieben werden. Für die adaptive 
Umweltmodellierung wird dabei eine Variante der Repräsentant-zu-Konzept 
Zuordnung benötigt, welche sich direkt in deren Verfahren integrieren lässt 
und auf der Bayes’schen Schätztheorie aufsetzt. Der existierende Ansatz von 
Belkin [Bel17] ist für diese Zwecke nicht geeignet, auch wegen der zuvor be- 
schriebenen unterschiedlichen Modellierungsannahmen. 


Für die adaptive Umweltmodellierung ist weiterhin eine einfache Varian- 
te der Repräsentant-zu-Konzept Zuordnung ausreichend, welche ein flaches 
Klassifikationsverfahren umsetzt. Dabei wird das Hintergrundwissensmo- 
dell Co vereinfachend rein als eine Menge von Konzepten betrachtet, genau- 
er gesagt als eine Teilmenge C. Diese Teilmenge kann beispielsweise, wie in 
Abschnitt 4.5.2 beschrieben, aus den probabilistisch modellierten Blattkno- 
ten der „is-a“-Generalisierungshierarchie bestehen. 


In dieser Arbeit wurde aus dargelegten Gründen eine eigene Variante der 
Repräsentant-zu-Konzept Zuordnung entwickelt und in [Kuw13b, Kuw16] 
vorgestellt. Diese Variante weist die oben beschriebenen Eigenschaften auf 
und besitzt weiterhin den Vorteil, eine geschlossene Berechnung der Zuord- 
nungswahrscheinlichkeiten zu ermöglichen. Die Variante basiert dabei auf 
der Idee, die Attribute eines Repräsentanten einzeln mit den Attributen ei- 
nes betrachteten Konzepts zu vergleichen. Der Vergleich soll dabei bewerten, 
wie sehr die in der Verteilung eines Repräsentanten-Attributs enthaltenen 
Werte auch in der Verteilung des modellierten Konzept-Attributs enthalten 
sind. Je mehr dies der Fall ist, so die Anschauung, desto eher gehört der Re- 
präsentant zum betrachteten Konzept (basierend auf der Betrachtung eines 
einzelnen Attributs). Somit lässt sich zunächst pro Attribut eine anteilige 
Repräsentant-zu-Konzept Zuordnung berechnen. Diese kann in Form einer 
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bedingten Wahrscheinlichkeitsverteilung dargestellt werden. Die derart be- 
rechneten Anteile können anschließend probabilistisch zu einer vollstandi- 
gen Repräsentant-zu-Konzept Zuordnung kombiniert werden. 


Nachfolgend wird in Abschnitt 6.2 zunächst die Herleitung der anteiligen 
Repräsentant-zu-Konzept Zuordnungen pro Attribut und deren Kombinati- 
on beschrieben, wie in [Kuw13b] präsentiert. In Abschnitt 6.3 wird dann die 
Umsetzung des Ansatzes beschrieben und demonstriert. Anschließend wer- 
den in Abschnitt 6.4 mögliche Erweiterungen und Verbesserungen dieses 
Ansatzes diskutiert, wie in [Kuw16] vorgestellt. 


6.2 Herleitung 


Der in dieser Arbeit entwickelte alternative Ansatz zur Repräsentant- 
zu-Konzept Zuordnung basiert auf einer Betrachtung, in welcher Re- 
präsentanten mit der gemeinsamen Wahrscheinlichkeitsverteilung ihrer 
probabilistischen Attribute gleichgesetzt werden. Unter der Annahme von 
stochastischer Unabhängigkeit wird die Zuordnung dann zunächst indivi- 
duell pro Attribut berechnet. Dazu werden die probabilistisch beschriebenen 
Attribute a’! € A, eines Repräsentanten r mit denen eines betrachteten 
Konzepts verglichen. Als Ergebnis dieses Vergleichs ergibt sich die beding- 
te Wahrscheinlichkeitsverteilung p(c|a”') über den Konzepten c € €. 
Diese Wahrscheinlichkeitsverteilung, welche eine anteilige Repräsentant- 
zu-Konzept Zuordnung repräsentiert, wird nachfolgend als attributbasierte 
Zuordnungswahrscheinlichkeit bezeichnet. 


Die beobachteten Attribute sind bei diesem Vorgehen wie erwähnt i. A. per- 
zeptive, nicht zustandsbezogene Attribute. Falls es angebracht ist, können 
allerdings auch deduktive Attribute in die Berechnung der Zuordnung mit 
aufgenommen werden. Die im Folgenden vorgestellte Methodik ist agnos- 
tisch für die szenarbezogene Rolle und Bedeutung von Attributen. Eine Ver- 
wendung semantischer Attribute ist allerdings widersinnig. 
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Attributbasierte Zuordnungswahrscheinlichkeiten betrachten jedes Attribut 
fiir sich. Um insgesamt die Zuordnungswahrscheinlichkeit eines Reprasen- 
tanten r zu einem gegebenen Konzept c berechnen zu können, müssen 
die einzelnen attributbasierten Wahrscheinlichkeiten kombiniert werden. 
Im nächsten Abschnitt wird zunächst auf die grundsätzliche Berechnung 
der attributbasierten Zuordnungswahrscheinlichkeiten eingegangen. Deren 
Kombination zum Gesamtergebnis der Repräsentant-zu-Konzept Zuord- 
nung wird anschließend in Abschnitt 6.2.2 beschrieben. 


6.2.1 Attributbasierte 
Zuordnungswahrscheinlichkeiten 


Zur Berechnung der attributbasierten Zuordnungswahrscheinlichkeiten 
p(c ja” +) wird ein Ansatz aus der Bayes’schen Schatztheorie verwendet. 
Einführend soll zunächst die folgende Problemstellung betrachtet werden. 


Rückwärtsinferenz 


Sei eine diskrete Zufallsvariable ce gegeben sowie eine weitere Zufallsvaria- 
ble r. Gesucht wird die Wahrscheinlichkeitsverteilung der Zufallsvariablen 
c, wenn die Zufallsvariable r bekannt ist, also die bedingte Wahrscheinlich- 
keitsverteilung p(c |r). Dazu sei weiterhin ein probabilistischer Zusammen- 
hang zwischen den beiden Zufallsvariablen gegeben, beschrieben über die 
bedingte Wahrscheinlichkeitsverteilung p(r |c), welche c zu r in Beziehung 
setzt. Würde für r nun ein (deterministischer) Wert beobachtet werden, d.h. 
eine Realisierung f, so kann unter Anwendung des Satzes von Bayes die ge- 
suchte bedingte Wahrscheinlichkeit als 


plelr) = => pfrle) - pl) (6.4) 


berechnet werden. Der Term z stellt hierbei einen Normierungsfaktor dar 
und p(c) beschreibt die A-priori-Verteilung der Zufallsvariablen c. Dieses 
Vorgehen stellt eine sog. Rückwärtsinferenz dar [Sch11], da von r auf c 
geschlossen wird, wohingegen der Zusammenhang der Zufallsvariablen in 
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Richtung von c zu r modelliert wurde. Eine Rückwärtsinferenz wird z.B. 
auch in der Datenassoziation (vgl. Abschnitt 5.2.1) verwendet, um auf Basis 
eines Beobachtungsmodells und einer konkreten Beobachtung die deskrip- 
tiven Attribute eines Repräsentanten aktualisieren zu können. 


Zuordnung als Rückwärtsinferenz 


Die attributbasierten Zuordnungswahrscheinlichkeiten p(c |a” +) werden in 
dieser Arbeit nun so interpretiert, dass als Zufallsvariable c ein Konzept 
c € € betrachtet wird, gegeben der Wert für ein Attribut a”! eines be- 
trachteten Repräsentanten. Unter dieser Interpretation könnte nun die Rück- 
wärtsinferenz in Gleichung (6.4) angewendet werden, um die Zuordnungs- 
wahrscheinlichkeit bzgl. a”! zu bestimmen. Dabei muss nun aber beach- 
tet werden, dass in der objektorientierten Umweltmodellierung Attribute 
nicht deterministisch über einen Wert â beschrieben werden, sondern pro- 
babilistisch mittels einer DoB-Verteilungen p(a). Für die betrachtete Rück- 
wärtsinferenz führt dies zu der Problematik, dass mit p(c ja” i) eine Wahr- 
scheinlichkeitsverteilung berechnet werden soll, welche formal auf eine an- 
dere Wahrscheinlichkeitsverteilung bedingt ist, nicht auf einen Wert. Dies 
ist nach Wahrscheinlichkeitstheorie nicht möglich [Sch11]. Um diese Pro- 
blematik zu umgehen, wird in [Sch11] die Einführung einer sog. Dummy- 
Variablen vorgeschlagen. 


Rückwärtsinferenz für unsichere Beobachtungen 


Sei d eine weitere Zufallsvariable, die Dummy-Variable. Zwischen den Zu- 
fallsvariablen d und r wird ebenfalls ein probabilistischer Zusammenhang 
angenommen. Dieser ergibt sich formal in Form der bedingten Wahrschein- 
lichkeit p(r la). Um nun formal korrekt beschreiben zu können, dass die 
Verteilung der Zufallsvariablen c auf die Verteilung der Zufallsvariablen r 
bedingt ist, wird die betrachtete Problemstellung in [Sch11] erweitert. Sei 
dazu p(r) zusätzlich die bekannte Verteilung für r (die Verteilung, auf wel- 
che c bedingt werden soll). In der erweiterten Problemstellung [Sch11] wird 
anstelle von p(c |) nun die bedingte Wahrscheinlichkeitsverteilung p(c ld ) 
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betrachtet, welche auf eine Beobachtung der Dummy-Variablen d bedingt 
ist. Um diese Verteilung durch Rückwärtsinferenz bestimmen zu können, 
muss zunächst die bedingte Wahrscheinlichkeit p(d |r) bestimmt werden, 
welche vom Wert d abhängt. Da d keine echte Beobachtung darstellt, wird 
die Bestimmung dieser bedingten Wahrscheinlichkeit nur formal durchge- 
führt. Nach [Sch11] kann zu diesem Zweck die Annahme getroffen werden, 
dass die Beobachtung von d zu einer Modifizierung der über r verfügba- 
ren Informationen führt. Diese Modifizierung wird dabei über die Verteilung 
p(r) beschrieben, wobei sich die formale Verteilung p(r ld ) dann als pro- 
portional zur bekannten Verteilung p(r) ergibt [Sch11]. Mit dem Satz von 
Bayes ergibt sich dann auch die zunächst gesuchte Verteilung p(d |r) als 
p(r). 

Auf Basis dieses Ergebnisses kann nun die Rückwärtsinferenz von d zu c 
durchgeführt werden [Sch11]. Dazu wird die gemeinsame Wahrscheinlich- 
keitsverteilung von c, r und d betrachtet und anhand der vorliegenden pro- 
babilistischen Zusammenhänge faktorisiert. Hierbei ergibt sich auch p(d |r) 
als ein Faktor, fiir welchen nach obiger Annahme p(r) eingesetzt werden 
kann. Insgesamt ergibt sich daraus dann die gesuchte bedingte Wahrschein- 
lichkeitsverteilung als 


pleld) = 5 - p(c) | eo) - p(rle) dr. (6.5) 


In dieser Gleichung stellt z wieder einen Normierungsfaktor dar und p(c) ist 
wieder die A-priori-Verteilung der Zufallsvariablen c. Das erweiterte Vorge- 
hen von [Sch11] unter Verwendung einer Dummy-Variablen wurde an die- 
ser Stelle nur verkürzt dargestellt. Einzelheiten sind in [Sch11] gegeben. 


Berechnung der attributbasierten Zuordnung 


Zur Berechnung der attributbasierten Zuordnungswahrscheinlichkeiten 
kann nun Gleichung (6.5) verwendet werden. Wie zuvor wird dabei c in 
(6.5) als eine Zufallsvariable über der Menge der Konzepte € interpretiert. 
Die Zufallsvariable r bezieht sich weiterhin auf ein beobachtetes Attribut 
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a"! eines Repräsentanten r. Somit wird p(r) als die Wahrscheinlichkeitsver- 
teilung Pgri(a) des Attributs a” i interpretiert. Unter dieser Interpretation 
beschreibt der probabilistische Zusammenhang zwischen c und r in Form 
der bedingten Wahrscheinlichkeitsverteilung p(r|c) in (6.5) dann, wie 
die Werte eines Attributs a verteilt sind, wenn ein Konzept c gegeben ist. 
Dabei wird a als ein Attribut ai des Konzepts c interpretiert, welches 
dieselbe Qualität beschreibt wie a” + also das zu a" korrespondierende 
Konzept-Attribut darstellt. Die Verteilung p(r |c) entspricht somit der im 
Konzept c modellierten DoB-Verteilung p,c,i; (a) für das Attribut ai. 
Nachfolgend wird das korrespondierende Konzept-Attribut ai abkürzend 
als a“! dargestellt. Somit kann Gleichung (6.5) unter der beschriebenen 
Interpretation als 


plela) = 2: pe) | pala) Paula) da (60 
R 


zur Berechnung der attributbasierten Zuordnungswahrscheinlichkeit für ein 
Attribut a’! genutzt werden. 


Bei diesem Vorgehen zur Berechnung der anteiligen Zuordnungswahr- 
scheinlichkeit wird der Vergleich eines Repräsentanten-Attributs mit dem 
korrespondierenden Konzept-Attribut durch eine Integration über dem Pro- 
dukt ihrer Wahrscheinlichkeitsverteilungen beschrieben. Anschaulich kann 
dies so interpretiert werden, dass aus der Verteilung des Konzept-Attributs 
diejenige Wahrscheinlichkeitsmasse gewichtet ausgewählt wird, welche 
mit der Verteilung des Repräsentanten-Attributs überlappt. 


6.2.2 Kombination der Anteile 


Um die Zuordnungswahrscheinlichkeit p(c |r) eines Reprasentanten r zu 
einem Konzept c insgesamt, d. h. über alle Attribute, beschreiben zu können, 
müssen die attributbasierten Zuordnungswahrscheinlichkeiten p(c |a" #) 
kombiniert werden. In der objektorientierten Umweltmodellierung wer- 
den die einzelnen Attribute von Reprasentanten bzw. von Konzepten als 
stochastisch unabhängig angenommen. 
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Iterative Kombination 


Unter dieser Voraussetzung kann ein iteratives Vorgehen zur Kombi- 
nation der attributbasierten Zuordnungswahrscheinlichkeiten definiert 
werden. In jedem Schritt eines solchen iterativen Vorgehens wird da- 
bei angenommen, dass im Schritt zuvor bereits die anteiligen Zuord- 
nungswahrscheinlichkeiten für die ersten k — 1 < n Attribute eines 
Repräsentanten zu einer gemeinsamen Zuordnungswahrscheinlichkeit 
Diele. „ar kombiniert wurden. Im aktuellen Schritt wird 
dann die anteilige Zuordnungswahrscheinlichkeit p(c |a” K) in die bis- 
herige gemeinsame Zuordnungswahrscheinlichkeit integriert, um eine 
neue gemeinsame Zuordnungswahrscheinlichkeit p(c ja” Tahar E) 
zu erhalten. Die Integration erfolgt, indem in Gleichung (6.6) für die priore 
Verteilung p(c) die bisherige gemeinsame Zuordnungswahrscheinlichkeit 
p(c le wee) des vorherigen Schritts angenommen wird. Im 
ersten Schritt wird als priore Verteilung initial eine Gleichverteilung über 
den Konzepten c € C angenommen. 


Unter Anwendung dieses iterativen Vorgehens können die attributbasier- 
ten Zuordnungswahrscheinlichkeiten plc ja” +) für i = 1,...,n nun zur 
Repräsentant-zu-Konzept Zuordnung p(c|r) = p(c|a"!,a”,..., a") 
kombiniert werden. Somit ergibt sich der in dieser Arbeit entwickelte 
alternative Ansatz zur Repräsentant-zu-Konzept Zuordnung insgesamt als 


le) = 4:2) J ( f panda) + paa) da) - 67 


ahleA, 


Das Produkt in Gleichung (6.7) wird dabei über die in einem Anwendungsfall 
betrachteten deskriptiven Attribute der Repräsentanten gebildet. Wie bereits 
erwähnt, betrifft dies i. A. die perzeptiven, nicht zustandsbezogenen Attribu- 
te. Das Attribut a®! im Integral stellt das zu einem Repräsentanten-Attribut 
a"! korrespondierende Konzept-Attribut dar. 
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Gleichung (6.7) beschreibt die Zuordnung des Repräsentanten r zu einem der 
Konzepte c € €. Um auf Basis dieser Gleichung die Verteilung der Zuord- 
nungswahrscheinlichkeit von r über allen Konzepten zu erhalten, müssen 
die pro Konzept erhaltenen Werte mittels des Faktors - normiert werden. 
Ähnlich wie im in [Bel17] beschriebenen Ansatz geht dieser Normierung 
hier ein einfacher Schwellwertvergleich voraus. Durch diesen Schwellwert- 
vergleich wird vor allem der Fall behandelt, dass für einen Repräsentanten 
nur nicht zuordenbare Konzepte mit sehr kleinen Zuordnungswerten vor- 
liegen. Eine einfache Normierung kann in diesem Fall dazu führen, dass 
durch die sich ergebende Verteilung auch nicht relevante Konzepte eine ho- 
he Wahrscheinlichkeit zugesprochen bekommen. Dies wird an dieser Stelle 
durch einen einfachen Ansatz verhindert. Einer genaueren Betrachtung die- 
ser Problematik widmet sich diese Arbeit in Abschnitt 6.4. 


6.3 Umsetzung und erste Demonstration des 
Ansatzes 


Der zuvor beschriebene Ansatz wird in dieser Arbeit zur Repräsentant-zu- 
Konzept Zuordnung verwendet. Für die Implementierung von Gleichung 
(6.7) müssen dabei diskrete von stetigen Attributen unterschieden werden. 
Für diskrete Attribute muss das Integral über dem Produkt der Verteilungen 
durch eine Summe ersetzt werden. Für stetige Attribute kann dieses Integral 
numerisch ausgewertet werden. Werden als stetige Wahrscheinlichkeitsver- 
teilungen nur Normalverteilungen oder Gaußmischverteilungen genutzt, so 
kann auch eine analytische Auswertung erfolgen. Diese basiert im Kern auf 
der Berechnung des Produkts der Dichtefunktionen zweier normalverteilter 
Zufallsvariablen. Der Vorteil einer analytischen Auswertung ist neben der 
Umgehung von numerischen Instabilitäten auch die sehr schnelle Berech- 
nung der Integralwerte. 
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6.3.1 Aufwandsbetrachtung und Berechnungsaspekte 


Allgemein betrachtet muss die Repräsentant-zu-Konzept Zuordnung für je- 
den Repräsentanten r € R berechnet werden. Dabei müssen pro Reprä- 
sentant alle Konzepte c € C betrachtet werden. Zur Berechnung der Zu- 


ordnungswerte müssen alle relevanten Attribute a” 


€ A, des Repräsen- 
tanten r mit den Konzept-Attributen A. verglichen werden. Die Relevanz 
von Attributen für die Repräsentant-zu-Konzept Zuordnung ergibt sich über 
die durch die Attribute beschriebenen Qualitäten der repräsentierten En- 
titäten. Relevant sind dabei Attribute für Qualitäten, deren Werte diskri- 
minativ in Bezug auf die Unterscheidung von Typen von Entitäten sind. 
Im Allgemeinen betrifft dies, wie zuvor bereits erwähnt, die perzeptiven, 
nicht zustandsbezogenen Attribute der Repräsentanten. Für diskrete Attri- 
bute muss dabei eine Summe über ihren Wertebereich berechnet werden. 
Für stetige Attribute mit Normalverteilung kann der Wert analytisch berech- 
net werden, für Attribute mit einer Gaußmischverteilung muss anschließend 
noch eine Summe über alle Komponenten berechnet werden. Der Berech- 
nungsaufwand der Repräsentant-zu-Konzept Zuordnung ist somit linear in 
der Anzahl der Repräsentanten und Konzepte sowie in der Anzahl der zu 
ihrer Beschreibung verwendeten Attribute und der Größe der Werteberei- 
che dieser Attribute. Somit ergibt sich insgesamt eine Zeitkomplexität von 
O(|R|- C|- |AF]| - |Sa)), wobei |A}]| die maximale Anzahl von Attributen 
pro Repräsentant beschreibt. Der Faktor |S% | beschreibt das Maximum über 
den größten Wertebereich der diskreten Attribute und die größte Anzahl von 
Komponenten in Gaußmischverteilungen der stetigen Attribute. 


Je nachdem, wie häufig die Zuordnung zwischen Repräsentanten und Kon- 
zepten bestimmt werden muss, kann die Berechnungsdauer der Zuordnung 
ins Gewicht fallen. Dies kann z.B. wichtig sein, wenn Echtzeitanforderun- 
gen an ein kognitives System bestehen. Im in Abschnitt 5.3.5 beschriebenen 
Verarbeitungsschema des objektorientierten Umweltmodells wird in jedem 
Zeitschritt die Zuordnung der Repräsentanten berechnet. 


Eine Neuberechnung gegenüber einem bereits zuvor berechneten Wert muss 
allerdings nur für die im aktuellen Zeitschritt veränderten Repräsentanten 
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erfolgen. Veränderungen ergeben sich für Repräsentanten in einem Zeit- 
schritt als Folge ihrer zeitlichen Fortschreibung und eventuellen Aktuali- 
sierung aufgrund einer Beobachtung. Für die Repräsentant-zu-Konzept Zu- 
ordnung sind dabei nur Änderungen an den der Zuordnung zugrunde ge- 
legten Attributen eines Repräsentanten relevant. Welche Attribute dies be- 
trifft, hängt auch von der Modellierung der Anwendungsdomäne ab. Eine 
einfache Ausgangslage kann dabei z.B. vorliegen, wenn eine zeitliche Fort- 
schreibung nur für zustandsbezogene perzeptive Attribute erfolgt und die 
statischen Eigenschaften von Objekten, wie z.B. deren Abmessungen, kei- 
ner Alterung unterliegen (modelliert durch einen Alterungsfaktor von 1). In 
dieser Situation hat die zeitliche Fortschreibung der Repräsentanten keinen 
Einfluss auf die für die Repräsentant-zu-Konzept Zuordnung relevanten At- 
tribute eines Repräsentanten. Relevante Änderungen an einem Repräsentan- 
ten ergeben sich dann nur aufgrund der Aktualisierung des Repräsentanten 
durch eine Beobachtung. Somit muss in dieser Situation auch nur für den 
bzw. die durch eine Beobachtung (anteilig) betroffenen und aktualisierten 
Repräsentanten eine Neuberechnung erfolgen. Ein solches Vorgehen kann, 
wenn aus Gründen der Laufzeiteffizienz gewünscht, auch unabhängig von 
der Domänenmodellierung erreicht werden. Dazu kann ein approximativer 
Verarbeitungsmodus für das objektorientierte Umweltmodell definiert wer- 
den, in welchem eine zeitliche Fortschreibung immer nur für die von einer 
Beobachtung betroffenen Repräsentanten erfolgt. 


Eine Neuberechnung muss ebenfalls erfolgen, wenn sich die Definition eines 
betrachteten Konzepts ändert. Dies kann z. B. im Rahmen der adaptiven Um- 
weltmodellierung der Fall sein. Wird hier die Definition eines Konzepts bzgl. 
seiner deskriptiven Attribute geändert, so muss eine Neuberechnung für alle 
Repräsentanten erfolgen. Dabei muss allerdings nur die Zuordnungswahr- 
scheinlichkeit zwischen dem geänderten Konzept und jedem Repräsentanten 
neu berechnet werden, die Zuordnungswahrscheinlichkeiten von unverän- 
derten Konzepten sind davon nicht betroffen. 
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6.3.2 Demonstrationsszenario 


Zur Demonstration des Ansatzes wird ein einfaches Beispielszenario ge- 
nutzt. Dieses Beispielszenario entstammt dem Bereich einer Haushaltsum- 
gebung und wurde in [Kuw13b] vorgestellt. Fir das einfache Demonstrati- 
onsszenario besteht die Menge C der für die Zuordnung relevanten Konzepte 
aus nur drei Konzepten: C = {Apfel, Banane, Kokosnuss}. Jedes Konzept wird 
beispielhaft über zwei Attribute beschrieben: ein diskretes Farbattribut und 
ein stetiges Längenattribut. Die Werte der Konzept-Attribute im Demons- 
trationsszenario sind in Tabelle 6.1 dargestellt. 


Tabelle 6.1: Die Menge € = {Apfel, Banane, Kokosnuss} der Konzepte in einem einfachen 
Demonstrationsszenario aus der Haushaltsdomäne, beschrieben über ein stetiges 
Längenattribut und ein diskretes Farbattribut. 


40 pla’) 1.0; pla?) 
30: N (0.09, 0.017) 0.87 
g t 0.6 
[Tif 
a. 20 aa. 
< 10F iis) . 
änge/m 0.25 = 
0.1 02 03 04 0.5 [Tarbe len| , 
40 pla’) 1.0 + p(a’) 
2 L 
v 30 N (0.18, 0.02") 0.8 
S || 20: 0.6 
S 
Ss || 10: 0.4} 
ae) Länge/m 02 
0.1 02 03 04 05 pe Fe 
40 -pla') 1.0 + p(a’) 
2 30 N (0.16, 0.015?) 0.8 } 
S || 20: 0.6 | 
[e] 
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Weiterhin sind Repräsentanten definiert, welche beobachtete Objekte repra- 
sentieren, darunter ein Apfel (Apfel1), eine Kokosnuss (Kokosnuss!) und ei- 
ne Birne (Birne1). Die Attributwerte der definierten Repräsentanten sind in 
Tabelle 6.2 dargestellt. Die Länge wird dabei jeweils als Normalverteilung 
N(u,o?) beschrieben und ist in Zentimetern angegeben. 


Tabelle 6.2: Beispielhafte Repräsentanten für ein einfaches Demonstrationsszenario mit zwei 


Attributen. 

Name Länge/cm Farbe 
Apfell N(8,0.5?) grün-gelb (1:1) 
Apfel2 N(7,0.22) rot 
Kokosnuss1 N(15 0,75) braun 
Birnel N(13, 0.2) grün-gelb (3:1) 


Erdbeere1 N(3.5 : 1?) rot 


6.3.3 Ergebnisse im Demonstrationsszenario 


Die Ergebnisse der Repräsentant-zu-Konzept Zuordnung für die drei ge- 
nannten Repräsentanten sind in Abbildung 6.1 dargestellt. Es ist erkennbar, 
dass der Apfel1-Repräsentant wie erwartet dem Konzept Apfel zugeordnet 
wird. Ebenso wird der Repräsentant Kokosnuss1 dem Konzept Kokosnuss zu- 
geordnet. Nur der Repräsentant Birne1 kann keinem der Konzepte in € ein- 
deutig zugeordnet werden. Hier ergibt sich als Ergebnis der Zuordnung eine 
Art verrauschte Gleichverteilung über C. Dieses Ergebnis ist erwartet und 
liegt darin begründet, dass in der zugrunde gelegten Konzeptmenge €C kein 
passendes Konzept enthalten ist. 


Die Repräsentant-zu-Konzept Zuordnung nach Gleichung (6.7) wird inner- 
halb der Verfahren der adaptiven Umweltmodellierung eingesetzt. Eine er- 
weiterte Demonstration des vorgestellten Ansatzes anhand eines umfang- 
reicheren Szenarios wird im Rahmen der Evaluation der adaptiven Umwelt- 
modellierung in Kapitel 8.5 beschrieben. Eine tiefergehende Betrachtung der 
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ptelr Apfell pt Kokosnuss1 pteln Birnel 
1.0 1.0 1.0 
0.8 0.8 0.8: 
0.6 0.6 0.6 | 
0.4 0.4 0.4} 
0.2 Apfel | B Kok 0.2 0.2} 
pfe anane Kokos. Apfel Banane | Kokos. ‘| Apfel \|Banane| | Kokos. 
f T "T i 


(a) Apfeli (b) Kokosnuss1 (c) Birnel 


Abbildung 6.1: Beispielhafte Ergebnisse der Repräsentant-zu-Konzept Zuordnung für un- 
terschiedliche Repräsentanten und die betrachtete Menge von Konzepten 
C = {Apfel, Banane, Kokosnuss}. 


Eigenschaften des Ansatzes, vor allem in Bezug auf die Normierung der Zu- 
ordnungswahrscheinlichkeiten, wird nachfolgend vorgestellt. 


6.4 Erweiterung der Zuordnung durch 
Nutzung von A-priori-Wissen 


Die Repräsentant-zu-Konzept Zuordnung wird innerhalb der probabilisti- 
schen Informationsverwaltung genutzt, um Repräsentanten mit semanti- 
schen Attributen anreichern zu können. Sie stellt auch eine Grundlage für 
eine quantitative Modellbewertung in der adaptiven Umweltmodellierung 
dar. Dabei erfolgt die Zuordnung probabilistisch in Form einer Wahrschein- 
lichkeitsverteilung. Bei der Zuordnung eines Repräsentanten zu Konzepten 
des Hintergrundwissens lassen sich nun zwei Extremfälle unterscheiden: 
einerseits kann ein Repräsentant gegeben sein, welcher eindeutig einem 
Konzept zugeordnet werden kann, wie z. B. in den Abbildungen 6.1a und 6.1b 
dargestellt. Andererseits kann die Situation vorliegen, dass ein Repräsentant 
keinem der betrachteten Konzepte erfolgreich zugeordnet werden kann. In 
diesem Fall ergibt sich eine inkonklusive Wahrscheinlichkeitsverteilung als 
Ergebnis, wie z.B. in Abbildung 6.1c gezeigt. In allen Fällen wird die Wahr- 
scheinlichkeitsverteilung mittels Gleichung (6.7) berechnet. Hierbei werden 
zunächst die Zuordnungswerte für alle betrachteten Konzepte zu einem 
Repräsentanten berechnet. Anschließend werden diese Werte normiert. Im 
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Fall, dass ein Reprasentant keinem Konzept eindeutig zugeordnet werden 
kann, kann diese Normierung zu Problemen fihren. 


6.4.1 Effekte der Normierung 


Der Kern dieser Probleme ist dabei die Tatsache, dass eine Normierung 
agnostisch ist für eine Unterscheidung von signifikanten gegenüber insigni- 
fikanten Abweichungen in den Zuordnungswerten. Zur Veranschaulichung 
soll folgende Situation betrachtet werden. Für eine Menge von zwei Konzep- 
ten seien zwei unterschiedliche Mengen von Zuordnungswerten gegeben, 
welche normiert werden sollen. Im ersten Fall seien die Zuordnungswerte 
{0.9,0.1} gegeben, im zweiten Fall die Zuordnungswerte {0.0009, 0.0001}. 
Der erste Fall modelliert dabei eine verrauschte, aber relativ eindeuti- 
ge Übereinstimmung eines betrachteten Repräsentanten mit dem ersten 
Konzept. Die zweite Menge von Zuordnungswerten beschreibt dagegen 
den betrachteten inkonklusiven Fall. Eine direkte Normierung dieser Zu- 
ordnungswerte führt in beiden Fällen dazu, dass der Repräsentant mit 
einer Wahrscheinlichkeit von 90% dem ersten Konzept zugeordnet wird. 
Im ersten Fall ist dies erwünscht, im zweiten Fall allerdings nicht. Hier 
wäre eine inkonklusive Wahrscheinlichkeitsverteilung ein angemessenes 
Zuordnungsergebnis. 


Die Normierungsproblematik kann nun den ungewünschten Effekt in der 
Repräsentant-zu-Konzept Zuordnung haben, dass ein Repräsentant immer 
dem ähnlichsten Konzept zugeordnet wird, unabhängig davon, ob überhaupt 
eine signifikante Ähnlichkeit zwischen Repräsentant und Konzept besteht. 
Diese Situation, in Abbildung 6.2 nochmals dargestellt, entspricht jedoch 
nicht dem beabsichtigten Vorgehen einer Repräsentant-zu-Konzept Zuord- 
nung. Daher muss eine Möglichkeit gefunden werden, solche Effekte ver- 
hindern zu können. 


Ein erster Ansatz, um das Auftreten dieses Effekts zu verhindern, liegt in 
der Verwendung eines einfachen Schwellwerts, z.B. analog zu [Bel17]. Da- 
bei kann der Schwellwert genutzt werden, um alle Zuordnungswerte, die 
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pteln) Erdbeere1 pteln Erdbeere1 

1.0 1.0 

0.8 0.8 

0.6 0.6 

0.4 0.4 

0.24 Apfel | Banane Kokos. 0.2} Apfel ||Banane|| Kokos. 
0 i 0 

(a) Ungewiinschte Zuordnung (b) Gewiinschte inkonklusive 
fiir Erdbeere1 Zuordnung 


Abbildung 6.2: Beispiel für eine Repräsentant-zu-Konzept Zuordnung mit dem ungewünsch- 
ten Effekt, dass durch die Normierung keine Unterscheidung von signifikan- 
ten gegenüber insignifikanten Zuordnungswerten gegeben ist (Teilabbildung 
(a)). Betrachtet werden der Repräsentant Erdbeerel und die Konzeptmenge 
{Apfel, Banane, Kokosnuss}, wie in den Tabellen 6.1 und 6.2 definiert. Teilab- 
bildung (b) stellt das gewünschte Ergebnis dar. 


unterhalb des Schwellwerts liegen, im Gesamtergebnis zu ignorieren. Prak- 
tisch kann dies z.B. erreicht werden, indem vor der Normierung alle Zu- 
ordnungswerte mit dem Schwellwert verglichen werden. Sind alle Werte 
kleiner als der Schwellwert, so wird als Ergebnis eine inkonklusive Vertei- 
lung zurückgegeben, anderenfalls erfolgt eine standardmäßige Normierung. 
Die Schwierigkeit dieses Ansatzes liegt nun in der Definition eines geeig- 
neten Schwellwerts. Dies liegt darin begründet, dass die berechneten Zu- 
ordnungswerte nicht nur von der Ähnlichkeit des betrachteten Repräsen- 
tanten und Konzepts anhängen. Weiterhin gehen auch Faktoren wie z.B. 
die verwendeten Wertebereiche der Attribute sowie, im Speziellen, die zur 
Darstellung stetiger Attribute genutzten Maßeinheiten in die Berechnung 
mit ein. In Abhängigkeit dieser Faktoren kann bereits die Größenordnung 
der Zuordnungswerte variieren. Anteile wie Wertebereiche und Maßeinhei- 
ten werden in der objektorientierten Umweltmodellierung dabei erst auf der 
Ebene von Domänen- oder Anwendungsmodellen festgelegt (vgl. Abschnitt 
4.5). Die Repräsentant-zu-Konzept Zuordnung stellt dagegen ein grundle- 
gendes Verfahren der objektorientierten Umweltmodellierung dar, dessen 
Abhängigkeiten von Aspekten der Domänen- und Anwendungsmodellie- 
rung möglichst minimiert werden sollten. In dieser Arbeit wird daher ein 
erweiterter Ansatz betrachtet, um das Auftreten des ungewünschten Nor- 
mierungseffekts in der Repräsentant-zu-Konzept Zuordnung verhindern zu 
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können. Der nachfolgend vorgestellte Ansatz wurde in [Kuw16] vorgestellt 
und basiert auf der Nutzung von A-priori-Wissen zur Unterscheidung von 
signifikanten gegenüber insignifikanten Zuordnungswerten. 


6.4.2 Erweiterte Repräsentant-zu-Konzept Zuordnung 


Die Ursache des beschriebenen Normierungseffekts liegt im Problem zu ent- 
scheiden, ob ein gegebener Zuordnungswert eine signifikante Ähnlichkeit 
zwischen Repräsentant und Konzept beschreibt oder nicht. Um diese Frage 
beantworten zu können, wird Wissen darüber benötigt, welche Größenord- 
nung für berechnete Zuordnungswerte zu erwarten ist. Dieselbe Frage muss 
ebenfalls für die Festlegung eines Schwellwerts beantwortet werden. In Be- 
zug auf einen absoluten Wert ist diese Frage nur sehr schwer zu beantwor- 
ten, da eine Antwort im Allgemeinen auch vom vorliegenden Anwendungs- 
fall abhängt. Eine Möglichkeit, die Größenordnung erwarteter Zuordnungs- 
werte abschätzen zu können, ist durch eine relative Betrachtung gegeben. 
Zu diesem Zweck wird in dieser Arbeit A-priori-Wissen eingesetzt. Dieses 
A-priori-Wissen betrifft dabei priore Verteilungen für die in einem Anwen- 
dungsfall betrachteten Qualitäten. 


Das grundlegende Vorgehen für eine Erweiterung der Repräsentant-zu- 
Konzept Zuordnung besteht nun darin, einen berechneten Zuordnungswert 
zu einem Wert in Bezug zu setzen, welcher den betrachteten Repräsen- 
tanten mit A-priori-Attributwerten vergleicht. Der Vergleich mit A-priori- 
Attributwerten kann dabei auf dieselbe Art und Weise berechnet werden wie 
der Vergleich mit einem Konzept. Dieser Vergleich liefert einen Basiswert. 
Berechnete Zuordnungswerte können nun relativ zu diesem Basiswert 
betrachtet und bewertet werden. Dabei kann dieser Basiswert z.B. als 
ein kontextsensitiver Schwellwert verstanden und genutzt werden: Zuord- 
nungswerte unterhalb dieses Basiswerts werden als insignifikant angesehen. 


In Bezug auf die Verwendung von A-priori-Verteilungen müssen weiterhin 
zwei Aspekte beachtet werden. Zum einen sind A-priori-Verteilungen für 
die Qualitäten eines Anwendungsfalls ebenfalls nicht unabhängig von der 
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Domänen- und Anwendungsmodellierung. Zum anderen stellen solche Ver- 
teilungen weitere Informationsartefakte dar, die während einer probabilis- 
tischen Modellierung der Domäne zu erstellen sind. Beide Aspekte hängen 
nun eng mit der Frage zusammen, wie solche A-priori-Verteilungen model- 
liert werden können. In dieser Arbeit wurden diesbezüglich unterschiedliche 
Ansätze betrachtet, welche nachfolgend vorgestellt werden. 


Modellierung von A-priori-Verteilungen für Qualitäten 


Die Grundidee für eine Modellierung solcher A-priori-Verteilungen in die- 
ser Arbeit ist es, solche Verteilungen möglichst automatisiert aus den in ei- 
nem Domänenmodell gegebenen Informationen ableiten zu können. Die A- 
priori-Verteilungen sind bei diesem Vorgehen zwar weiterhin von der Domä- 
nenmodellierung abhängig. Allerdings ist nun aber kein manuelles Eingrei- 
fen zur Parametrierung der Repräsentant-zu-Konzept Zuordnung mehr not- 
wendig, wie dies z. B. beim manuellen Einstellen von Schwellwerten der Fall 
wäre. Somit ist diese Grundidee geeignet, beide der oben genannten Aspek- 
te zu adressieren. Ein erster Ansatz zur Ableitung von A-priori-Verteilungen 
ist es, für jede Qualität eine Gleichverteilung über ihrem Wertebereich als A- 
priori-Verteilung zu definieren. Bei diesem Ansatz wird somit nur das Wis- 
sen über den Wertebereich einer Qualität benötigt. Dieses Wissen ist in der 
objektorientierten Umweltmodellierung im jeweiligen Domänenmodell hin- 
terlegt. 


Ein zweiter Ansatz ist es, nicht nur den Wertebereich einer Qualität als In- 
formation in eine A-priori-Verteilung einfließen zu lassen, sondern auch tat- 
sächliches Vorwissen über die Verteilung der Werte relevanter Entitäten für 
diese Qualität. Solche Informationen sind in einem Domänenmodell in Form 
der Konzept-Verteilungen der Attribute zu dieser Qualität verfügbar. Eine 
A-priori-Verteilung für eine Qualität kann also definiert werden, indem eine 
gewichtete Summe aus den Verteilungen aller probabilistisch modellierten 
Konzepte gebildet wird (bzw. aller Konzepte in ©). Die Verwendung einer 
solchen rein summierten Verteilung zur Berechnung eines Basiswerts für 
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die Reprasentant-zu-Konzept Zuordnung bietet allerdings noch keinen Vor- 
teil. Dies liegt darin begründet, dass Repräsentanten, welche zu keinem der 
modellierten Konzepte hinreichend ähnlich sind, auch beim Vergleich mit ei- 
ner summierten Verteilung dieser Konzepte keine hinreichende Ähnlichkeit 
aufweisen. Anschaulich gesprochen liegen die Repräsentanten in Bereichen, 
in welchen keines der Konzepte eine signifikante Wahrscheinlichkeitsmas- 
se aufweist. Folglich weist auch die summierte Verteilung der Konzepte in 
solchen Bereichen i. A. keine oder nur eine sehr geringe Wahrscheinlich- 
keitsmasse auf. Ein derartiges Problem besteht bei der Verwendung einer 
Gleichverteilung als A-priori-Verteilung im Übrigen nicht. Für den zweiten 
Ansatz ist es somit notwendig, auch in nicht von den Konzepten abgedeckten 
Bereichen eine nicht verschwindende Wahrscheinlichkeit zu definieren. Die 
Werte einer Wahrscheinlichkeitsverteilung in solchen Bereichen sollten da- 
bei von den gegebenen Konzept-Verteilungen beeinflusst werden. Dies kann 
z.B. erreicht werden, indem die berechnete summierte Verteilung anschlie- 
Bend durch eine Generalisierungsoperation verallgemeinert wird. Anschau- 
lich gesprochen entspricht dies einer Verbreiterung der Verteilung, bei wel- 
cher ein Teil der Wahrscheinlichkeitsmasse in die Bereiche abfließt, welche 
den Konzept-Verteilungen benachbart sind. Für eine solche Generalisierung 
können die in Abschnitt 8.4.3 beschriebenen Verfahren des Konzeptlernens 
eingesetzt werden, falls als stetige Konzept-Verteilungen nur Normal- und 
Gaußmischverteilungen vorkommen. 


Somit können zwei unterschiedliche Ansätze genutzt werden, um A-priori- 
Verteilungen für Qualitäten automatisiert abzuleiten. Die Verwendung von 
Gleichverteilungen über den definierten Wertebereichen bietet dabei den 
Vorteil, dass der Ansatz einfach ist und keine weiteren Anforderungen 
besitzt. Der zweite Ansatz beruht auf der Generalisierung einer über die 
Konzept-Attribute summierten Verteilung. Diese Verteilung ist dabei in- 
formativer als eine reine Gleichverteilung, was bei der Normierung von 
Zuordnungswerten vorteilhaft sein kann. Um diesen zweiten Ansatz nutzen 
zu können, ist allerdings eine ausreichende Anzahl an für eine Anwendung 
repräsentativen Konzepten erforderlich. Anderenfalls kann es passieren, 
dass die Abdeckung der generalisierten Wahrscheinlichkeitsverteilung für 
die Wertebereiche einzelner Qualitäten nur unzureichend ist. 
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Nutzung von A-priori-Verteilungen zur Normierung 


Unter der Annahme, dass für jede relevante Qualität eine A-priori- 
Verteilung gegeben ist, kann die Repräsentant-zu-Konzept Zuordnung 
durch eine verbesserte Normierung erweitert werden. Die Verbesserung 
basiert dabei auf der Unterscheidung von signifikanten gegenüber insigni- 
fikanten Zuordnungswerten zwischen Repräsentanten und Konzepten. 


Eine Umsetzung dieser Unterscheidung erfolgt durch den Vergleich von 
Zuordnungswerten mit einen Basiswert, welcher unter Verwendung der 
A-priori-Verteilungen für die Attribute abgeleitet wird. Ein solcher Ver- 
gleich kann nun an unterschiedlichen Stellen in der Berechnung der 
Repräsentant-zu-Konzept Zuordnung erfolgen. Einerseits können bereits 
die attributbasierten Zuordnungswerte darauf geprüft werden, ob sie ei- 
ne signifikante Ähnlichkeit des Repräsentanten-Attributs zum jeweils 
betrachteten Konzept-Attribut beschreiben. Andererseits können auch 
erst die kombinierten Zuordnungswerte auf eine signifikante Ähnlichkeit 
zwischen Repräsentant und betrachtetem Konzept geprüft werden. Beide 
Möglichkeiten wurden in dieser Arbeit betrachtet. 


Der in dieser Arbeit verfolgte Ansatz basiert allgemein auf der Idee, die auf- 
tretenden Zuordnungswerte interpretierbar zu machen und unabhängig von 
einem Anwendungsfall darzustellen. Als interpretierbare Größe wird hier ei- 
ne Darstellung der Zuordnungswerte in Form von Vielfachen der Basiswer- 
te angesehen. Dies betrifft zunächst die pro Konzept berechneten attribut- 
basierten Zuordnungswerte fg Dari( a) : Paci(a) da. Diese werden in ei- 
nem ersten Ansatz als Vielfache der Basiswerte dargestellt, welche sich tiber 
das zuvor genannten Integral ergeben, wenn die Verteilung des Konzept- 
Attributs durch die entsprechende A-priori-Verteilung ersetzt wird. Ein at- 
tributbezogener Basiswert b(a”") ergibt sich also als 


b(a") := [ Pari(@) * Paoi(a) da , (6.8) 


wobei p4o,(a) die zu a” | korrespondierende A-priori-Verteilung darstellt. 
Für diskrete Attribute wird das Integral durch eine Summe ersetzt, analog 
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zum Vorgehen für Gleichung (6.7). Ein kombinierter Basiswert b(r) für einen 
Repräsentanten r kann analog zur Kombination der attributbasierten Zuord- 
nungswerte als b(r) := Ilerie a, b( ar!) berechnet werden. Mit diesen 
Definitionen können die als Vielfache der Basiswerte skalierten attributba- 
sierten Zuordnungswerte somit als 


zi Sr Pari(@) > Paci(a) da 

p(c |a” Jp = OT ar) (6.9) 
beschrieben werden. Diese prä-skalierten Zuordnungswerte lassen sich an- 
schließend wie zuvor durch das beschriebene iterative Vorgehen zu einem 
kombinierten Zuordnungswert pro Konzept zusammenfügen. Dabei stellt 
auch dieser kombinierte Zuordnungswert eine interpretierbare Größe dar, 
nämlich ein Vielfaches des Produkts der Basiswerte b(r). Der kombinier- 
te Zuordnungswert kann somit gegen einen vorab definierten Schwellwert 
verglichen werden, um zu entscheiden, ob eine signifikante Ähnlichkeit des 
verglichenen Repräsentanten r zum betrachteten Konzept c vorliegt. Ein ent- 
sprechender Schwellwert kann bei diesem Ansatz bereits zur Entwurfszeit 
und unabhängig vom konkreten Anwendungsfall festgelegt werden. Nichts- 
destotrotz stellt ein solcher Schwellwert einen weiteren zu definierenden Pa- 
rameter für die probabilistische Informationsverwaltung dar. 


Der Vergleich der kombinierten Zuordnungswerte pro Konzept gegen einen 
Schwellwert liefert einen Hinweis, ob eine signifikante Ähnlichkeit zu einem 
Konzept vorliegt oder nicht. Als Ergebnis der Repräsentant-zu-Konzept Zu- 
ordnung wird allerdings eine Wahrscheinlichkeitsverteilung über allen be- 
trachteten Konzepten erwartet. Somit muss in einem entsprechenden An- 
satz also noch eine Normierung durchgeführt werden, unter Beachtung der 
Ergebnisse des Schwellwertvergleichs. Dies kann über eine Fallunterschei- 
dung erfolgen: überschreitet der kombinierte Zuordnungswert für mindes- 
tens eines der betrachteten Konzepte den Schwellwert, so wird eine stan- 
dardmäßige Normierung durchgeführt. Ist dies nicht der Fall, liegen also al- 
le kombinierten Zuordnungswerte unterhalb des Schwellwerts, so wird eine 
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angepasste Normierung durchgeführt. Für eine solche angepasste Normie- 
rung sind nun ebenfalls unterschiedliche Vorgehen denkbar. Beispielswei- 
se könnte, unabhängig von den gegebenen Zuordnungswerten, einfach ei- 
ne Gleichverteilung als Ergebnis zurückgegeben werden. Andererseits kann 
auch die in den Zuordnungswerten enthaltene Information über deren rela- 
tive Größen zueinander für eine Normierung beachtet werden. In dieser Ar- 
beit wurde dabei ein Vorgehen gewählt, in welchem die Zuordnungswerte 
anteilig in die aus der Normierung resultierende Verteilung eingehen. Da- 
zu wird für eine angepasste Normierung zunächst zu jedem kombinierten 
Zuordnungswert ein weiterer Wert addiert, bevor anschließend eine Nor- 
mierung erfolgt. Für das Ergebnis der Normierung spielt dabei das Verhältnis 
zwischen addiertem Wert und den gegebenen Zuordnungswerten eine Rolle. 
Dieses Verhältnis bestimmt, wie sehr die Unterschiede zwischen den kom- 
binierten Zuordnungswerten pro Konzept in das Ergebnis der Normierung 
eingehen. Eine auf das bisherige Vorgehen abgestimmte Möglichkeit ist die 
Angabe des zu addierenden Werts in Form eines Vielfachen des kombinier- 
ten Basiswerts b(r). Im Falle einer angepassten Normierung liegen per Defi- 
nition alle kombinierten Zuordnungswerte unterhalb des Schwellwerts, wel- 
cher als ein Vielfaches des kombinierten Basiswerts definiert ist. Gleichzeitig 
wird nun ein Vielfaches dieses Basiswerts als zu addierender Wert genutzt. 
Durch dieses Vorgehen lässt sich somit gezielt einstellen, wie stark die Un- 
terschiede in den Zuordnungswerten in die resultierende Zuordnungswahr- 
scheinlichkeit einfließen sollen. Je höher der addierte Wert, desto mehr wird 
sich die resultierende Wahrscheinlichkeitsverteilung einer Gleichverteilung 
annähern. Dieses Vorgehen wird zur Parametrierung der angepassten Nor- 
mierung einer erweiterten Repräsentant-zu-Konzept Zuordnung genutzt. 


Die sich nach der Normierung ergebende Wahrscheinlichkeitsverteilung 
stellt schließlich das Ergebnis der Repräsentant-zu-Konzept Zuordnung dar. 
Das zuvor beschriebene Vorgehen stellt einen ersten Ansatz zur Erweite- 
rung der Repräsentant-zu-Konzept Zuordnung dar. Dieser Ansatz wird als 
Prä-Skalierung! bezeichnet (vgl. Gleichung (6.9)), da hier eine Skalierung der 


1 In [Kuw16] wird der Ansatz im Englischen als „Leveling“ bezeichnet, mit Bezug auf das Ein- 
ebnen der normierten Verteilung im Falle eines nicht zuordenbaren Repräsentanten. 
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attributbasierten Zuordnungswerte bereits vor ihrer Kombination erfolgt. 
Für eine Umsetzung des Ansatzes zu Demonstrationszwecken wurde als 
Schwellwert das 1.5-fache des kombinierten Basiswerts b(r) gewählt und 
als zu addierender Wert der Basiswert selbst. Der Ansatz der Prä-Skalierung 
zeichnet sich durch eine Fallunterscheidung aus. Liegt eine signifikante 
Ähnlichkeit des gegebenen Repräsentanten zu einem oder mehreren der 
betrachteten Konzepte vor, so erfolgt keine Anpassung der Normierung, 
anderenfalls schon. Durch diese Fallunterscheidung bleibt die Zuordnungs- 
wahrscheinlichkeit im Falle einer signifikanten Ähnlichkeit unverändert. 
Die Berechnung dieser Zuordnungswahrscheinlichkeit erfolgt aufgrund 
der Fallunterscheidung allerdings nicht mehr einheitlich. Eine Möglichkeit, 
beide Fällen einheitlich zu betrachten, wird in einem zweiten Ansatz zur 
Erweiterung der Repräsentant-zu-Konzept Zuordnung vorgestellt. 


Dieser zweite, als Post-Skalierung bezeichnete Ansatz kombiniert die attri- 
butbasierten Zuordnungswerte ohne vorherige Skalierung. Eine Skalierung 
erfolgt in diesem Ansatz erst für die kombinierten Zuordnungswerte. Dabei 
wird jeder dieser Zuordnungswerte als 


p(e Pasi = Te 7 (6.10) 


skaliert. Anstelle der beiden Basiswerte b(r) können auch hier Vielfache 
genutzt werden, um die Skalierung entsprechend einzustellen. In dieser Ar- 
beit werden für den zweiten Ansatz allerdings direkt die Basiswerte genutzt. 
Dieser zweite Ansatz stellt eine Erweiterung der Repräsentant-zu-Konzept 
Zuordnung in geschlossener Form dar. Ein Nachteil dieses Ansatzes ist je- 
doch, dass auch die Zuordnungswahrscheinlichkeit im Falle einer signifikan- 
ten Ähnlichkeit etwas in Richtung einer Gleichverteilung verschoben wird. 
Diese „Verwässerung“ liegt darin begründet, dass bei diesem Ansatz immer 
der kombinierte Basiswert zum Zuordnungswert addiert wird. Dieser Effekt 
wird z.B. in Abbildung 6.3b sichtbar. 


277 


6 Bayes’sche Repräsentant-zu-Konzept Zuordnung 


6.4.3 Evaluation der erweiterten Zuordnung 


Die vorgeschlagenen Erweiterungen der Repräsentant-zu-Konzept Zuord- 
nung wurden ebenfalls für das in Abschnitt 6.3.2 vorgestellte einfache De- 
monstrationsszenario evaluiert. Ergebnisse dieser Evaluation sind in Abbil- 
dung 6.3 dargestellt. Dabei wurde wieder wie bisher die beispielhafte Kon- 
zeptmenge {Apfel, Banane, Kokosnuss} betrachtet sowie die beiden Reprä- 
sentanten Apfel1 und Erdbeere1, wie in den Tabellen 6.1 und 6.2 definiert. 
Zuerst wird die Zuordnung von Apfell zur Konzeptmenge betrachtet, wo- 
bei als Ergebnis eine eindeutige Zuordnung zum Konzept Apfel erwartet 
wird. Abbildung 6.3a stellt das Zuordnungsergebnis für den ersten Ansatz 
mit Prä-Skalierung dar, Abbildung 6.3b das Ergebnis für den zweiten Ansatz 
mit Post-Skalierung. Die Wahrscheinlichkeitsverteilung der Zuordnung ent- 
spricht für beide Ansätze dem erwarteten Ergebnis. Für die Post-Skalierung 
ist die leichte „Verwässerung“ der Verteilung zu erkennen. In Abbildung 
6.3c ist die Zuordnung des Repräsentanten Erdbeere1 zur Konzeptmenge un- 
ter Anwendung des ersten Ansatzes dargestellt. Im Gegensatz zum bisheri- 
gen Ergebnis der Repräsentant-zu-Konzept Zuordnung (vgl. Abbildung 6.2a) 
wird durch die Erweiterung nun auch in diesem Fall, wie gewünscht, eine 
inkonklusive Wahrscheinlichkeitsverteilung als Zuordnung zurückgegeben. 


pteln) Apfell ptelr) Apfel ptelr) Erdbeerel 
1.0 (Prä-Skalierung)| 11.0 (Post-Skalierung)| |1.0 (Prä-Skalierung) 
0.8 0.8 0.8 

0.6 0.6 0.6 

0.4 0.4 0.4 

0.2} Apfel | Banane Kokos. 0.2|| Apfel | Banane Kokos. 0.2 Apfel ||Banane|| Kokos. 
0 | Jo 0 


(a) Erweiterte Zuordnung für (b) Erweiterte Zuordnung für (c) Erweiterte Zuordnung für 
Repräsentant Apfeli mit Repräsentant Apfel1 mit Reprasentant Erdbeere1 mit 
Pra-Skalierung Post-Skalierung Pra-Skalierung 


Abbildung 6.3: Beispielhafte Ergebnisse der erweiterten Repräsentant-zu-Konzept Zuordnung 
unter Verwendung von A-priori-Verteilungen. Dabei werden zwei Repräsen- 
tanten (Apfell, Erdbeere1) der Konzeptmenge {Apfel, Banane, Kokosnuss} zuge- 
ordnet unter Verwendung der Ansätze mit Prä- oder Post-Skalierung der Zu- 
ordnungswerte. Wie erwartet kann Apfell durch beide Ansätze eindeutig zu- 
geordnet werden, wobei die Post-Skalierung zur einer leichten Verwässerung 
führt. Für Erdbeere1 ergibt sich wie gewünscht eine inkonklusive Verteilung. 
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Neben der Evaluation in einem Demonstrationsszenario, welche die grund- 
sätzliche Anwendbarkeit demonstriert, wird die erweiterte Repräsentant-zu- 
Konzept Zuordnung auch in einem komplexeren Anwendungsszenario eva- 
luiert. Die entsprechenden Ergebnisse werden in Kapitel 8 beschrieben. Eine 
weitere Evaluation findet auch zusammen mit der nachfolgend beschriebe- 
nen quantitativen Modellbewertung statt. 


6.5 Zusammenfassung 


In diesem Kapitel wurde die Repräsentant-zu-Konzept Zuordnung in der 
objektorientierten Umweltmodellierung betrachtet. Nach einer allgemeinen 
Einführung in die Thematik wurde mit [Bel17] ein existierender Ansatz dis- 
kutiert. Da dieser Ansatz sich an einigen Stellen von den in dieser Arbeit 
getroffenen Grundannahmen unterscheidet, wurde anschließend ein eigener 
alternativer Ansatz vorgestellt. Für diesen Ansatz wurde das Thema der Nor- 
mierung vertieft betrachtet und es wurden verschiedene Erweiterungen vor- 
geschlagen, welche unter der Verwendung von A-priori-Wissen eine verbes- 
serte Normierung ermöglichen. Alle vorgeschlagenen Ansätze wurden an 
einem Demonstrationsszenario in Bezug auf ihre grundsätzliche Anwend- 
barkeit evaluiert. Diese Ansätze zur Repräsentant-zu-Konzept Zuordnung 
finden Anwendung in der nachfolgend vorgestellten adaptiven Umweltmo- 
dellierung. Die in diesem Kapitel beschriebenen eigenen Ergebnisse wurde 
in [Kuw13b] sowie [Kuw16] veröffentlicht. 
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Das zentrale Thema dieser Arbeit ist die Erweiterung der objektorientierten 
Umweltmodellierung hin zu einer adaptiven Umweltmodellierung, welche 
in Kapitel 3 im Überblick vorgestellt wurde. Dabei wurden u.a. die der ad- 
aptiven Umweltmodellierung zugrunde gelegten Prinzipien dargelegt und 
ihre unterschiedlichen Aufgaben vorgestellt. Eine wichtige Aufgabe ist da- 
bei durch die quantitative Bewertung der Güte eines Hintergrundwissens- 
modells gegeben. Die Güte eines Hintergrundwissensmodells quantifiziert 
dabei, wie sehr ein Modell in der Lage ist, die beobachtete Umgebung und 
ihre Entitäten zu beschreiben und zu erklären. Diese Modellgüte stellt dabei 
im Gegensatz zu anderen Bewertungsmaßen der adaptiven Umweltmodellie- 
rung ein globales Maß für das objektorientierte Umweltmodell dar. Sie kann 
daher dazu dienen, die adaptive Wissensverwaltung auf einer übergeord- 
neten Ebene zu steuern und zu koordinieren. Der Ansatz der quantitativen 
Modellbewertung wurde in [Kuw13a] vorgestellt. 


In der Modellbewertung wird betrachtet, wie gut ein Hintergrundwissens- 
modell dazu geeignet ist, die Repräsentanten des Weltmodells durch ihre 
zugeordneten Konzepte im Hintergrundwissen zu beschreiben. Die Annah- 
men, die bezüglich des Hintergrundwissensmodells und der betrachteten 
Konzeptmenge € C Co getroffen werden, decken sich daher mit den An- 
nahmen, die in Abschnitt 6.1.3 für den vorgestellten alternativen Ansatz der 
Repräsentant-zu-Konzept Zuordnung getroffen wurden. So wird beispiels- 
weise ebenfalls ein flaches Wissensmodell € angenommen. Für die darin 
enthaltenen Konzepte werden ebenfalls nur deskriptive Attribute betrach- 
tet, d. h. perzeptive, nicht zustandsbezogene Attribute und eventuell ausge- 
wählte deduktive Attribute. Die genannten Attributmengen für Konzepte 
A. und Repräsentanten A, beziehen sich in diesem Abschnitt ebenfalls auf 
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diese deskriptiven Attribute, wenn nicht explizit anders angegeben. Die Be- 
trachtung nur solcher Attribute ist auch hier rein semantisch motiviert. Für 
die entworfenen Verfahren spielt der Szenarmodus der Attribute keine Rolle. 
Weiterhin wird in der Modellbewertung die Annahme getroffen, dass die be- 
trachtete Konzeptmenge C pro Zweig der „is-a“-Generalisierungshierarchie 
nur ein Konzept enthält. Eine Bewertung der hierarchischen Strukturierung 
eines Wissensmodells erfolgt somit nicht. 


7.1 Gewähltes Vorgehen 


Zur Entwicklung eines Maßes für die quantitative Bewertung von Hinter- 
grundwissensmodellen wurde ein Ansatz gewählt, welcher auf dem Prinzip 
der minimalen Beschreibungslänge (MDL' , z.B. [Grü07]) basiert. 


7.1.1 Das Prinzip der minimalen Beschreibungslänge 


Das MDL-Prinzip kann als ein Informationskriterium zur Modellselektion 
eingesetzt werden. Das Problem der Modellselektion besteht darin, für eine 
gegebene Menge von Daten D := {x;, y;} ein passendes Modell zu finden. Da- 
bei kann z.B. eine Regressionsaufgabe vorliegen, in welcher als Modell ein 
funktionaler Zusammenhang y = h(x) zwischen x und y gefunden werden 
soll. Nach dem Prinzip der minimalen Beschreibungslänge [Ris78] kann ein 
Modell verwendet werden, um die Daten {x;, y;} komprimiert darzustellen. 
Dazu müssen zunächst Regularitäten in den Daten gefunden werden. Die- 
se können anschließend in einem Modell abgebildet werden [Grü07]. Unter 
Verwendung dieses Modells ist nun eine komprimierte Darstellung der Da- 
ten möglich. Anstelle einer Darstellung der Daten als (x;,y;)-Paare müssen 
bei Verwendung eines Modells nur noch die x-Werte und das Modell selbst 
dargestellt werden. Die y-Werte können für gegebene x-Werte dann jeweils 
aus dem Modell berechnet werden. In realen Anwendungsfällen sind die Da- 
ten {x;, yi} jedoch häufig verrauscht, so dass i. A. keine exakte Darstellung 


* Englisch: minimum description length 
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der y-Werte durch die Modellwerte h(x) möglich ist. In diesem Fall kann 
anstelle eines y-Werts nur noch seine Abweichung vom Modellwert h(x) 
dargestellt werden. Für die Darstellung von Daten mittels eines Modells gilt 
allgemein: je besser das Modell zu den Daten passt, desto weniger Beschrei- 
bung wird zur Darstellung der Daten benötigt [Grü07]. Je besser also ein 
Modell in der Lage ist, die gegebenen y-Werte zu beschreiben, desto weni- 
ger Beschreibung wird für die Darstellung ihrer Abweichung von den Mo- 
dellwerten h(x) benötigt. 


Nach dem MDL-Prinzip wird nun aus einer gegebenen Menge von Model- 
len dasjenige Modell ausgewählt, welches die geringste Beschreibungslänge 
besitzt. Das MDL-Prinzip stellt dabei einen ganzheitlichen Ansatz dar, in 
welchem neben der Beschreibungslänge der Daten auch die Beschreibungs- 
länge des Modells selbst mit eingeht. Eine erhöhte Beschreibungslänge für 
ein Modell korrespondiert dabei allgemein mit einem komplexeren Modell, 
welches auch in der Lage ist, komplexere funktionale Zusammenhänge zwi- 
schen den Daten {x;, yi} zu beschreiben. Komplexere Modelle zeichnen sich 
i. A. durch eine erhöhte Anzahl an Freiheitsgraden aus und erfordern somit 
auch eine längere Beschreibung. Im Gegenzug können komplexere Modelle 
eine genauere Beschreibung der Daten ermöglichen und vermögen so die 
Beschreibungslänge der Daten zu reduzieren. 


Das MDL-Prinzip stellt nun der Beschreibungslänge der Daten, welche ein 
Maß für die Modellgüte darstellt, die Beschreibungslänge des Modells ge- 
genüber. Diese stellt ein Maß für die Modellkomplexität dar. Ausgewählt 
wird dann dasjenige Modell, welches die geringste kombinierte Beschrei- 
bungslänge für Daten und Modell besitzt. Durch dieses ausbalancierte Vor- 
gehen lässt sich eine Überanpassung des Modells an die Daten verhindern. 
Ein überangepasstes Modell neigt zum Auswendiglernen von Daten. Ein sol- 
ches Modell liefert dann zwar gute Ergebnisse für genau diese Daten, genera- 
lisiert aber i. A. schlecht auf weitere, ungesehene Daten. Durch Anwendung 
des MDL-Prinzips kann eine solche Überanpassung verhindert werden. 
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7.1.2 MDL-basiertes Vorgehen 


In dieser Arbeit wurde das MDL-Prinzip als Grundlage für eine quantitative 
Modellbewertung gewählt. Dies liegt darin begründet, dass die quantitati- 
ve Modellbewertung eine ähnlich gelagerte Problemstellung beschreibt und 
eine Balance zwischen Modellkomplexität und Modellgüte auch in der Um- 
weltmodellierung eine wünschenswerte Eigenschaft ist. Weiterhin ist das 
MDL-Prinzip als ein Informationskriterium auch geeignet, um in Bezug auf 
eine Steuerung der in der adaptiven Umweltmodellierung anfallenden Auf- 
gaben auf einer übergeordneten Ebene angewendet zu werden. Diese Aufga- 
ben betreffen z.B. die Änderungen und Anpassungen des Wissensmodells. 
Somit steuert die Modellbewertung ein globales Gütemaß für Hintergrund- 
wissensmodelle zur adaptiven Umweltmodellierung bei. 


Der grundlegende Ansatz zur quantitativen Modellbewertung wird in Ab- 
schnitt 7.2 beschrieben. Die Abschnitte 7.3 und 7.4 beschreiben anschlie- 
Bend, wie in der adaptiven Umweltmodellierung die Bewertung der Mo- 
dellkomplexität und der Beschreibungslänge der Daten erfolgt. In Abschnitt 
7.5 wird der Aufwand dieser quantitativen Modellbewertung diskutiert. Ab- 
schnitt 7.6 demonstriert schließlich die quantitative Modellbewertung an ei- 
nem Beispielszenario und stellt Evaluationsergebnisse vor. 


7.2 Grundlegender Ansatz 


Ein Maß für eine quantitative Bewertung der Güte eines Hintergrundwis- 
sensmodells soll die Fähigkeit des Modells bewerten, die in einer beobachte- 
ten Umgebung angetroffen Typen von Entitäten darstellen zu können. Diese 
Entitäten werden dabei durch die Repräsentanten im Weltmodell repräsen- 
tiert. In dieser Arbeit wird ein Vorgehen genutzt, welches dem MDL-Prinzip 
folgt. Dabei existieren unterschiedliche Ansätze zur Umsetzung des MDL- 
Prinzips [Grü07]. In dieser Arbeit wird konzeptionell auf einem einfachen 
Ansatz aufgesetzt. 
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7.2.1 Einfacher MDL-Ansatz 


Der einfache Ansatz’ zur Umsetzung des MDL-Prinzips wird von Grünwald 
[Grü07] beschrieben. Dabei wird die Güte eines Modells M durch das zu- 
sammengesetzte Maß 


L(D) := L(D|M) + L(M) (7.1) 


für die Beschreibungslange L(D) der Daten D unter Anwendung des Mo- 
dells M bewertet. Der erste Summand L (D | M ) repräsentiert die Beschrei- 
bungslänge der Daten D unter Verwendung des Modells. Der zweite Sum- 
mand reprasentiert die Beschreibungslange L(M) fiir das Modell selbst. Die- 
se beiden Terme sind im Allgemeinen negativ korreliert. Das bedeutet, dass 
es ein komplexeres Modell ermöglicht, die Daten auf eine kürzere Weise zu 
beschreiben. Die Betrachtung beider Terme zugleich bietet den beschriebe- 
nen Schutz vor einer Uberanpassung des Modells an die Daten. 


7.2.2 MDL-basierter Ansatz zur quantitativen 
Modellbewertung 


Dieser einfache Ansatz nach dem MDL-Prinzip kann nun auf die Berech- 
nung der quantitativen Modellgüte für die adaptive Umweltmodellierung 
übertragen werden. Relevante Anteile des objektorientierten Umweltmo- 
dells sind dabei die Menge der Konzepte € C Cg im Hintergrundwissen, 
welche die Entitätstypen und somit die Zuordnungsziele für Repräsentanten 
darstellen. Weiter ist die Menge R der im Weltmodell enthaltenen Repräsen- 
tanten ein wichtiger Parameter. Jeder Repräsentant r € R wird dabei über 
seine (deskriptiven) Attribute A, beschrieben, jedes Konzept c € € über die 
modellierten (deskriptiven) Attribute A.. Weiterhin spielt die probabilisti- 
sche Zuordnung von Repräsentanten zu Konzepten in Form der bedingten 
Wahrscheinlichkeit p(c|r) eine wichtige Rolle. 


In [Grü07] englisch als „crude MDL“ bezeichnet. 


285 


7 Quantitative Modellbewertung 


Auf Grundlage dieser Parameter kann ein quantitatives Maß Q( - ) zur Mo- 
dellbewertung in Analogie zum einfachen MDL-Ansatz (7.1) somit als 


Q(R,C) := L(R|C) + L(C) (7.2) 


definiert werden. Durch dieses Maß wird die Modellgüte bewertet. Dabei be- 
schreibt der erste Summand L (R | €) die Korrespondenz der Repräsentan- 
ten im Weltmodell zu den betrachteten Konzepten des Hintergrundwissens. 
Der zweite Summand L(C) beschreibt die Komplexität des Modells. Wie die- 
se beiden Terme für das objektorientierte Umweltmodell berechnet werden 
können, wird in den nachfolgenden Abschnitten dargestellt. 


7.3 Modellkomplexitat 


Als ein Anteil in der quantitativen Modellbewertung muss die Komplexi- 
tät eines Hintergrundwissensmodells bewertet werden. Dem MDL-Prinzip 
folgend, sollte ein Bewertungsmaß dabei die Komplexität eines Modells pro- 
portional zu dessen Beschreibungslänge bewerten. Die Beschreibungslänge 
stellt die Länge einer entsprechenden Repräsentation des Modells dar, ge- 
messen z.B. in der Anzahl benötigter Zeichen. Diese Vorstellung muss nun 
auf ein Maß für die Komplexität eines Hintergrundwissensmodells übertra- 
gen werden. Diesbezüglich werden in dieser Arbeit die nachfolgend darge- 
stellten Grundannahmen getroffen. 


Als relevantes Hintergrundwissen für die adaptive Umweltmodellierung 
wird die Teilmenge € der zuordenbaren Konzepte betrachtet. Die Komple- 
xität eines Hintergrundwissensmodells lässt sich somit als die Komplexität 
L(C) dieser Konzeptmenge betrachten. Dabei wird weiterhin die Annahme 
gemacht, dass jedes in € enthaltene Konzept c in gleichen Anteilen zur 
Gesamtkomplexität des Modells beiträgt. Die Modellkomplexität L (C) 
kann daher als die Summe der individuellen Komplexitäten L (c) der in € 
enthaltenen Konzepte c berechnet werden. 
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7.3.1 Konzeptkomplexitat 


Unter dieser Annahme muss als nächstes die Komplexität eines einzelnen 
Konzepts betrachtet werden. Relevante Parameter eines Konzepts sind dabei 
Art, Anzahl und Werte seiner deskriptiven Attribute. Auch die Komplexität 
eines Konzepts soll proportional zur für das Konzept benötigten Beschrei- 
bungslänge bewertet werden. In dieser Arbeit wird nun von einem positiven 
Zusammenhang zwischen Beschreibungslänge eines Konzepts und dem De- 
taillierungsgrad dieser Beschreibung ausgegangen: je detaillierter ein Kon- 
zept beschrieben wird, desto größer ist die Länge der dafür benötigten Be- 
schreibung. Detaillierter beschriebene Konzepte stellen somit komplexere 
Konzepte dar. Gleichzeitig repräsentieren detaillierter beschriebene Konzep- 
te auch spezifischere Typen von Domänen-Entitäten in dem Sinne, dass die 
modellierten Eigenschaften dieser Entitäten genauer festgelegt sind. Zwi- 
schen der Komplexität eines Konzepts und seiner Spezifität besteht somit 
ebenfalls ein positiver Zusammenhang. Ein Konzept kann somit als des- 
to komplexer betrachtet werden, je mehr (deskriptive) Attribute es besitzt. 
Denn die Angabe jedes Attributs erhöht den Detaillierungsgrad einer Be- 
schreibung. Ein Konzept kann ebenfalls als komplexer betrachtet werden, 
je genauer die Eigenschaften von Entitäten in den modellierten Attributen 
beschrieben werden. Eine genauere Modellierung erhöht die Spezifität eines 
Konzepts und somit dessen Komplexität. Diese zweite Aussage betrifft aller- 
dings bereits die Bewertung von Attributen. Für die Berechnung der Kom- 
plexität eines Konzepts folgt schließlich, dass je mehr (deskriptive) Attribute 
ein Konzept besitzt, als desto komplexer es gelten muss. Weiterhin kann an- 
genommen werden, dass jedes Attribut in gleichen Teilen (jedoch abhängig 
von seiner konkreten Verteilung) zur Komplexität des Konzepts beiträgt. So- 
mit lässt sich die Komplexität L (c) eines Konzepts als die Summe der Kom- 
plexitäten L (aci) seiner (deskriptiven) Attribute a®! € A, bewerten. 
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Berechnung der Modellkomplexität Setzt man nun die bisher getroffenen 
Annahmen zusammen, so kann die Komplexität L (C) eines Hintergrundwis- 
sensmodells € zusammengefasst als die Summe 


LO := $ }, L(a) (7.3) 


CEC aic A, 


berechnet werden. Durch diesen Ansatz wird die Berechnung der Komple- 
xität eines Hintergrundwissensmodells abgebildet auf eine Berechnung der 
Beschreibungslänge von Konzept-Attributen. 


7.3.2 Attributkomplexität 


Als nächstes müssen somit Attribute betrachtet werden. Die Komplexität 
L(a“) eines Attributs wird auf Basis des dargestellten Attributwerts bewer- 
tet. In der objektorientierten Umweltmodellierung ist dieser Wert in Form 
einer DoB-Verteilung pc, (a) gegeben. Somit stellt sich nun die Frage, wie 
die Komplexitat der DoB-Verteilung eines modellierten Attributs bewertet 
werden kann. Wie zuvor motiviert, wird in dieser Arbeit von der Annahme 
ausgegangen, dass ein Attribut als komplexer zu betrachten ist, je spezifi- 
scher es seine Werte beschreibt. Diese Annahme überträgt sich auf die Be- 
wertung der Attributverteilung. Dabei können Konzentrationsmaße einge- 
setzt werden, um zu bewerten, wie spezifisch eine Wahrscheinlichkeitsver- 
teilung ihre Werte beschreibt. Die zugrunde liegende Annahme ist hierbei, 
dass durch eine stärker konzentrierte Attributverteilung weniger Werte für 
ein Konzept zulässig sind. Und je weniger Werte eines vorgegebenen Wer- 
tebereichs zulässig sind, desto spezifischer wird ein Attribut, und somit ein 
Konzept, beschrieben. 


Komplexität diskreter Attribute 
Als Konzentrationsmaß für Wahrscheinlichkeitsverteilungen wird in dieser 


Arbeit die Shannon’sche Entropie H(-) eingesetzt. Für ein diskretes Attribut 
af, mit Wahrscheinlichkeitsverteilung Pas (a) und Wertebereich S, ergibt 
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sich diese Entropie als 


H(aj) = — % Pas(a) > log( pas(a) ) - (7.4) 


aESa 


Um mittels der Shannon’schen Entropie bewerten zu können, wie spezifisch 
ein modelliertes Attribut ist, wird folgender Ansatz genutzt. Je stärker kon- 
zentriert die Werte eines Attributs in seiner Verteilung modelliert sind, desto 
kleiner ist die Entropie dieser Verteilung. Gleichzeitig beschreiben stärker 
konzentrierte Werte auch ein spezifischeres Attribut. Entropie und Spezifi- 
tät stehen also in einem negativen Zusammenhang. In Folge ist ein Attribut 
somit weniger komplex, je größer die Entropie seiner Verteilung ist. Der ma- 
ximale Wert, den die Entropie einer Verteilung annehmen kann, wird von der 
Kardinalität des Wertebereichs S, eines diskreten Attributs bestimmt. Die- 
ser Maximalwert wird beim Vorliegen einer Gleichverteilung angenommen 
und ergibt sich als log ( |Sa |). Dieser Fall beschreibt zugleich die minimale 
Komplexität, die ein Attribut bei einem vorgegebenen Wertebereich aufwei- 
sen kann. Für ein diskretes Attribut aj mit Wertebereich Sq lässt sich die 
Komplexität L (a§ ) somit über den Ansatz 


Li(aġ) := log( ISal) - H( aq) (7.5) 


berechnen. Dieser Ansatz bezieht explizit die Größe des Wertebereichs Sa 
mit ein. Im Falle einer Gleichverteilung nimmt die Komplexität hier einen 
Wert von 0 an. Als maximalen Wert kann die Komplexität bei gegebenem 
Wertebereich einen Wert annehmen, der in seiner Größe dem Maximalwert 
der Entropie für diesen Wertebereich entspricht. Als Alternative zu diesem 
Ansatz kann auch eine in Bezug auf ihren Wertebereich normalisierte Kom- 
plexität definiert werden. Diese kann als 


pj aa H( a; ) 
L,(a§ ) := 1- log( [Sal ) (7.6) 


berechnet werden und nimmt nur Werte aus dem Intervall [0,1] an. 
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Komplexität stetiger Attribute 


Für die Verteilungen stetiger Attribute kann die Shannon’sche Entropie 
nicht direkt berechnet werden. Eine mögliche Alternative ist durch die Nut- 
zung der sog. differentiellen Entropie H(a) = — f pa(a) - log(p.(a)) da 
gegeben, als ein Maß der Entropie für stetige Zufallsvariablen. Diese dif- 
ferentielle Entropie unterscheidet sich allerdings von der Shannon’schen 
Entropie und besitzt einige für eine quantitative Modellbewertung nicht 
wünschenswerte Eigenschaften. Dazu zählt, dass die differentielle Entropie 
nicht skalierungsinvariant ist, was z.B. für in unterschiedlichen Maßein- 
heiten gegebene Attribute zu Problemen führen kann. Weiterhin kann die 
differentielle Entropie negative Werte annehmen, was problematisch für 
den dargelegten kumulativen Ansatz der Modellbewertung ist. Auch unter- 
scheidet sich der Wert der differentiellen Entropie für eine stetige Verteilung 
von demjenigen Wert, gegen den eine Diskretisierung dieser Verteilung für 
ein gegen 0 gehendes Diskretisierungsintervall konvergiert [Cov91]. 


In dieser Arbeit wird daher nicht die differentielle Entropie zur Berechnung 
der Komplexität stetiger Attribute verwendet. Stattdessen werden stetige At- 
tribute für eine Berechnung ihrer Komplexität zunächst diskretisiert. Dieses 
Vorgehen ist dabei von Arbeiten [Bel12a] im Bereich der objektorientierten 
Umweltmodellierung motiviert, in welchen die Unsicherheit bzgl. der Erken- 
nung vorliegender Situationen bewertet werden soll. 


Kleinster unterscheidbarer Betrag Die zugrunde liegende Idee geht dabei 
auf Oswald [Osw91] zurück und betrifft einen kleinsten unterscheidbaren 
Betrag! für ein stetiges Merkmal. Die Annahme ist dabei, dass für ein stetiges 
Merkmal ein kleinster Betrag angegeben werden kann, dessen Unterschei- 
dung für die Anwendungsdomäne gerade noch relevant ist. So kann sich z. B. 
die benötigte Genauigkeit für Positionsangaben je nach Anwendungsdomä- 
ne unterscheiden. Eine natürliche Wahl für diesen kleinsten unterscheidba- 
ren Betrag kann dabei anhand der Messunsicherheit der genutzten Sensorik 
getroffen werden [Bel12a]. Für die objektorientierte Umweltmodellierung 


* Englisch: least discernible quantum (LDQ) 
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bedeutet die Verwendung solcher kleinster unterscheidbarer Beträge, dass 
diese Größen pro Qualität zusätzlich zu den bisherigen Angaben in einem 
Domänenmodell festgelegt werden müssen, und zwar zur Entwurfszeit des 
Systems. Somit muss auch das Metamodell des objektorientierten Umwelt- 
modells um diesen Parameter erweitert werden. 


Diskretisierung stetiger Attribute Unter Anwendung kleinster unter- 
scheidbarer Beträge A, kann ein stetiges Attribut a diskretisiert werden. Da- 
zu wird der Wertebereich des Attributs in Intervalle der Länge A, unterteilt. 
Jedem Intervall wird durch Integration diejenige Wahrscheinlichkeitsmasse 
zugeordnet, welche die stetige Wahrscheinlichkeitsverteilung über diesem 
Bereich insgesamt besitzt. Nach der Diskretisierung kann das durch Glei- 
chung (7.5) definierte Komplexitätsmaß für diskrete Attribute angewendet 
werden. In dieses Komplexitätsmaß fließt neben der diskretisierten Wahr- 
scheinlichkeitsverteilung auch die Mächtigkeit des diskretisierten Wertebe- 
reichs mit ein. 


7.4  Modellkorrespondenz 


Der zweite Summand neben der Modellkomplexität in der quantitativen 
Modellbewertung (7.2) beschreibt die Korrespondenz eines Hintergrund- 
wissensmodells mit den im Weltmodell enthaltenen Repräsentanten. Das 
Analogon zu diesem Term nach MDL-Prinzip ist die Beschreibungslän- 
ge, welche benötigt wird, um gegebene Daten unter Verwendung eines 
betrachteten Modells zu beschreiben. Für die Modellbewertung nimmt 
die Menge der Repräsentanten R die Rolle der Daten ein, und das Hin- 
tergrundwissensmodell € die Rolle des Modells. Die vom MDL-Prinzip 
motivierte Grundannahme in dieser Arbeit ist, dass eine Beschreibung 
von Repräsentanten auf desto kürzere Weise erfolgen kann, je besser ein 
Repräsentant durch ein Konzept dargestellt werden kann. Genauer gesagt 
ist die anschauliche Idee, dass, wenn ein Repräsentant vollständig durch ein 
Konzept beschrieben werden kann, keine weitere Beschreibung mehr für 
diesen Repräsentanten notwendig ist. Ist dies nur teilweise möglich, besitzt 
ein Repräsentant also Anteile, die nicht von einem Konzept dargestellt 
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werden können, so fällt hingegen weiterer Beschreibungsaufwand an. Die 
Tatsache, dass ein Repräsentant durch ein Konzept beschrieben werden 
kann, wird dabei als Korrespondenz zwischen Repräsentant und Konzept 
bzw. zwischen Hintergrundwissen und Weltmodell bezeichnet, und die 
Stärke ihrer Ausprägung als Modellqualität. 


7.4.1 Kumulative Berechnung der 
Modellkorrespondenz 


Zur Bestimmung der Korrespondenz L (R | € ) der Repräsentanten des Welt- 
modells zu den Konzepten des Hintergrundwissens wird ein ähnlicher An- 
satz wie bei der Bewertung der Modellkomplexität gewählt. Dabei wird zu- 
nächst die individuelle Korrespondenz L (r | c ) eines Repräsentanten r € R 
zu einem Konzept c € € betrachtet. Die Modellkorrespondenz ergibt sich 
dann kumulativ als die Summe der individuellen Korrespondenzen über al- 
le Repräsentanten. Es wird davon ausgegangen, dass jeder Repräsentant in 
gleichen Teilen zur Modellkorrespondenz beiträgt. Pro Repräsentant r exis- 
tiert nun aber nicht nur ein Korrespondenzwert, sondern ein Korrespon- 
denzwert von r zu jedem Konzept c. Somit stellt sich die Frage, wie diese 
Werte für die unterschiedlichen Konzepte in die Gesamtberechnung einflie- 
Ben sollten. Von praktischer Relevanz ist in der objektorientierten Umwelt- 
modellierung für einen Repräsentanten dasjenige Konzept, mit welchem es 
über die Repräsentant-zu-Konzept Zuordnung assoziiert wurde. Erfolgt die- 
se Zuordnung in Form einer harten Entscheidung, dann fließt pro Reprä- 
sentant nur der Korrespondenzwert für dieses zugeordnete Konzept in die 
Modellkorrespondenz mit ein. Im Allgemeinen erfolgt die Zuordnung aller- 
dings probabilistisch, d.h. in Form einer diskreten Wahrscheinlichkeitsver- 
teilung über den Konzepten in C. Diese diskrete Wahrscheinlichkeitsvertei- 
lung kann nun mehr als einem Konzept eine nichtverschwindende Zuord- 
nungswahrscheinlichkeit zuweisen. Um auch in diesem Fall die Gesamtkor- 
respondenz eines Modells auf Basis der individuellen Korrespondenzen von 
Repräsentanten berechnen zu können, wird in dieser Arbeit die erwarte- 
te Korrespondenz auf Basis der Zuordnungswahrscheinlichkeit berechnet. 
Dies kann erreicht werden, indem jeder individuelle Korrespondenzwert mit 
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seiner Zuordnungswahrscheinlichkeit gewichtet wird. Unter diesem Ansatz 
ergibt sich die Modellkorrespondenz L(R | C) kumulativ als die Summe 


L(R|€) := % 2% poln): Lila) (7.7) 


rjeR cjee 


der gewichteten individuellen Korrespondenzwerte L (r; | Gj ). 


7.4.2 Individuelle Repräsentant-zu-Konzept 
Korrespondenz 


Somit muss als nächstes die individuelle Korrespondenz eines Repräsentan- 
ten r zu einem Konzept c betrachtet werden. Ebenfalls analog zum Vorge- 
hen bei der Komplexitätsbewertung wird hier diese individuelle Korrespon- 
denz aufBasis der jeweiligen Attribute A, und A. bewertet. Dabei wird wie- 
derum die Annahme getroffen, dass diese attributbasierten Korrespondenz- 
werte sich in Summe zur individuellen Korrespondenz von Repräsentant zu 
Konzept ergeben. Wenn gewünscht, kann hierbei eine unterschiedliche Ge- 
wichtung der einzelnen Attribute vorgenommen werden. Zur Berechnung 
der individuellen Korrespondenz wird somit für jedes Attribut a”! € A, des 
Repräsentanten ein attributbasierter Korrespondenzwert zum korrespondie- 
renden Attribut a®! € A, des betrachteten Konzepts berechnet. Die Attri- 
bute a" und a®! müssen dabei passend sein, d.h. dieselbe Qualität beschrei- 
ben. Die individuelle Korrespondenz zwischen Repräsentant r und Konzept 
c ergibt sich folglich als die gewichtete Summe 


L(n|g) := >) wa - L(a |a), (7.8) 


ahieA, 


in welcher optional pro Attribut a"! Gewichte wg genutzt werden können. 
Solche Gewichte müssen ebenfalls als weitere Parameter im Domänenmo- 
dell pro Qualität spezifiziert werden. 
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7.4.3 Attributbasierte Korrespondenzwerte 


Die attributbasierten Korrespondenzwerte L (a i | acl ) stellen ein Maf dar, 
welches die Verteilung eines Repräsentanten-Attributs zu der eines Konzept- 
Attributs in Beziehung setzt. Dem MDL-Prinzip folgend, soll ein solches 
Maß bewerten, wie viel zusätzliche Beschreibung zur Darstellung der Ver- 
teilung des Repräsentanten-Attributs benötigt wird, wenn die Verteilung 
des Konzept-Attributs als Ausgangsbasis zugrunde gelegt wird. Anschau- 
lich gesprochen wird in dieser Arbeit dabei die Annahme getroffen, dass 
für eine Verteilung, deren Werte vollständig in der Verteilung des Konzept- 
Attributs enthalten sind, keine zusätzliche Beschreibung notwendig ist. So 
würde z.B. für eine Gleichverteilung auf dem Intervall [2,3], gegeben ein 
Konzept-Attribut mit ebenfalls einer Gleichverteilung, jedoch auf dem Inter- 
vall [1,5], kein zusätzlicher Beschreibungsaufwand anfallen. Für eine Gleich- 
verteilung auf dem Intervall [0,3] wäre dagegen eine zusätzliche Beschrei- 
bung notwendig. Hier müsste der Bereich [0,1] beschrieben werden, welcher 
nicht vom Konzept-Attribut abgedeckt wird. Als zugrunde liegendes Krite- 
rium, von welchem der zusätzliche Beschreibungsaufwand abhängt, ergibt 
sich somit die Überlappung der betrachteten Verteilungen. 


Diskrete Korrespondenzmaße 


Zur Berechnung der Modellkomplexität erfolgt eine Diskretisierung von 
stetigen Attributen anhand des kleinsten unterscheidbaren Betrags A, für 
solche Attribute. Für die Berechnung der attributbasierten Korrespondenz- 
werte kann folglich angenommen werden, dass nur diskrete Verteilungen 
zu betrachten sind. Als konkrete Maße zur Bewertung der Korrespondenz 
von diskreten Verteilungen kommen unterschiedliche Funktionen in Frage. 
Ein mögliches Maß, welches in der objektorientierten Umweltmodellierung 
z.B. bereits im Weltmodell eingesetzt wird [Bel12b], ist die Kullback- 
Leibler Divergenz. Die diskrete Kullback-Leibler Divergenz oder relative 
Entropie [Cov91] zwischen einem Repräsentanten-Attribut a”! und einem 
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Konzept-Attribut a! ergibt sich dabei als 


D(a” || a“) = » Pari (a) > log ( Ber) ; (7.9) 


aESa Pasii (a) 


wobei S, den Wertebereich des Attributs a”! bezeichnet. Die relative En- 
tropie misst, wie unterschiedlich zwei gegebene Wahrscheinlichkeitsvertei- 
lungen sind und besitzt nicht-negative Werte. Ein ähnliches Maß für die 
Unterschiedlichkeit zweier Wahrscheinlichkeitsverteilungen ist die Kreuz- 
entropie. Diese ergibt sich für die Attribute a”! und a“! als 


H(a"™, ae = ` Pari (a) + log( Paci (a) ) - (7.10) 


aESa 


Weiterhin kann auch ein Maß genutzt werden, welches der oben beschrie- 
benen Intuition der Überdeckung einer Verteilung durch eine andere Ver- 
teilung nachempfunden ist. Für eine solche diskrete, skalierte Überdeckung 
zwischen a”! und aĉ wird in dieser Arbeit die Summe 


Lo (a"*, añ) := b> lo( Pari (a) , Paci (a) , n(a™, a°)) (7.11) 


aeSa 
von bedingten Differenzen 


0, falls n- pı < D2 


| pı — P2 |, sonst (7.12) 


lo (Pi; P2) := | 
definiert. Der Parameter y stellt dabei einen Skalierungsfaktor zwischen den 
Attributen dar. Dieses Maß berechnet für jeden Wert des Wertebereichs Sa 
die Differenz zwischen der Verteilung par,i (a) des Repräsentanten-Attributs 
und der Verteilung pyc, (a) des Konzept-Attributs, falls der skalierte Wert 
des Repräsentanten-Attributs größer ist als der Wert des Konzept-Attributs. 
Dies modelliert den Fall, dass ein Wert des Repräsentanten-Attributs nicht 
vom Konzept-Attribut überdeckt wird. Somit fällt also zusätzlicher Beschrei- 
bungsaufwand an, welcher durch die Differenz der Werte quantifiziert wird. 
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Skalierung des Repräsentanten-Attributs Zur Skalierung der Werte des 
Repräsentanten-Attributs für den Vergleich zum Konzept-Attribut wird der 
Faktor n (a"', a°*) in Abhängigkeit der Attributverteilungen berechnet. 
Dieser Faktor wird dabei so gewählt, dass das Maximum der Verteilung des 
Repräsentanten-Attributs unterhalb des kleinsten relevanten Hochpunkts 
als lokalem Maximum der Verteilung des Konzept-Attributs liegt. Die Idee 
hinter diesem heuristischen Ansatz ist, dass stetige Konzept-Attribute 
im Umweltmodell als Normal- oder Gaußmischverteilungen beschrieben 
werden, somit also potentiell multimodale Dichtefunktionen darstellen 
können. Zur Bestimmung der bedingten Differenzen über die Gleichungen 
(7.11) und (7.12) wird ein Repräsentanten-Attribut nun so skaliert, dass 
es unterhalb der kleinsten Komponente einer Gaußmischverteilung liegt. 
Diese Skalierung wird beim Vergleich der Werte der Verteilungen angewen- 
det. Damit soll modelliert werden, dass ein Repräsentanten-Attribut durch 
jede Komponente einer multimodalen Mischdichte eines Konzept-Attributs 
beschrieben werden kann. Wird es durch mindestens eine der Kompo- 
nenten beschrieben, fällt somit kein zusätzlicher Beschreibungsaufwand 
an. Der Skalierungsfaktor wird dabei auf den diskretisierten Verteilun- 
gen der stetigen Attribute berechnet. Auch für per se diskrete Attribute 
kann dieser Skalierungsansatz verwendet werden. Dazu wird zusätzlich 
ein Minimalwert für Hochpunkte eingeführt. Nur Hochpunkte, die größer 
als dieser Minimalwert sind, werden als relevant für die Skalierung be- 
trachtet. Durch dieses Vorgehen sollen zu kleine Skalierungen verhindert 
werden, z.B. für nominale Attribute. Der Skalierungsansatz wurde in dieser 
Arbeit für das diskrete Überdeckungsmaß (7.11) entwickelt. Der Ansatz 
kann aber auch als ein Vorverarbeitungsschritt für andere Maße zum Ver- 
gleich von Repräsentanten-Attributen zu Konzept-Attributen bzgl. ihrer 
Korrespondenz genutzt werden. 


Vergleich der Bewertungsmaße 


Die Eigenschaften und Unterschiede der unterschiedlichen vorgestellten 
Maße zur Berechnung der attributbasierten Korrespondenzwerte werden 
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in Abschnitt 7.6 zusammen mit einer Evaluation des Gesamtansatzes der 
Modellbewertung vorgestellt. 


7.5 Aufwandsbetrachtung 


Die Gütebewertung eines Hintergrundwissensmodells über den beschriebe- 
nen Ansatz zur quantitativen Modellbewertung dient in der adaptiven Um- 
weltmodellierung als eine übergeordnete Steuergröße. Die Güte eines Hin- 
tergrundwissensmodells muss somit in regelmäßigen Abständen bewertet 
werden, jedoch nicht notwendigerweise in Echtzeit (vgl. das grundlegende 
Verarbeitungsschema des Umweltmodells in Abschnitt 5.3.5). Zur Abschät- 
zung des Berechnungsaufwands einer solchen Gütebewertung soll nachfol- 
gend die Zeitkomplexität des vorgeschlagenen Ansatzes zur quantitativen 
Modellbewertung betrachtet werden, unterteilt in die Anteile der Modell- 
komplexität und der Modellkorrespondenz sowie Gemeinsames. 


7.5.1 Diskretisierung stetiger Attribute 


Sowohl für die Berechnung der Modellkomplexität als auch für die Be- 
rechnung der Modellkorrespondenz wird eine Diskretisierung der stetigen 
Attribute von Konzepten und Repräsentanten benötigt. Die Diskretisierung 
erfolgt dabei in Bezug auf die im Hintergrundwissen je Qualität definierten 
kleinsten unterscheidbaren Beträge. Im in dieser Arbeit verfolgten Ansatz 
zur objektorientierten Umweltmodellierung werden stetige Attribute nur 
parametrisch mittels Normal- oder Gaußmischverteilung dargestellt. Zur 
Berechnung der Wahrscheinlichkeitsmasse pro diskretem Intervall muss 
somit, ggf. mehrfach für unterschiedliche Komponenten einer Mischvertei- 
lung, die kumulative Verteilungsfunktion der Normalverteilung in Bezug 
auf das Intervall ausgewertet werden. Diese Auswertung ist auf Basis der 
Gauß’schen Fehlerfunktion effizient möglich. Eine endliche Anzahl an Kom- 
ponenten für Mischverteilungen vorausgesetzt, kann der Zeitaufwand zur 
Diskretisierung eines stetigen Attributs unter diesen Bedingungen daher 
als linear in der Anzahl der Diskretisierungsintervalle angesehen werden. 
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7.5.2 Aufwandsabschätzung der 
Modellkomplexitätsbewertung 


Zur Berechnung der Modellkomplexität muss jedes Konzept c € € betrach- 
tet werden. Pro Konzept müssen dabei alle deskriptiven Attribute a®! € 
A. betrachtet und bewertet werden. Zur Bewertung eines Attributs muss 
die Spezifität seiner Verteilung bestimmt werden. Für ein diskretes Attribut 
muss dabei jedes Element seines Wertebereichs S, betrachtet werden und 
dessen Wahrscheinlichkeit logarithmiert, multipliziert und summiert wer- 
den. Somit ergibt sich eine Zeitkomplexität von O (|C| - |A&| - |Sq|) für die 
Modellbewertung. Hierbei beschreibt |A;| analog zur Aufwandsbetrachtung 
für die Repräsentant-zu-Konzept Zuordnung die maximale Anzahl von de- 
skriptiven Attributen pro Konzept und der Faktor |Sġ| die maximale Grö- 
ße der Wertebereiche der diskreten oder diskretisierten Attribute. Der für 
die Diskretisierung der stetigen Attribute zusätzlich anfallende Diskretisie- 
rungsaufwand liegt ebenfalls in O (|C| - |A&] - |Sq|) und erhöht die Zeitkom- 


plexität der Modellkomplexitätsbewertung somit nicht. 


Weiterhin ist eine Neuberechnung der Modellkomplexität nur dann notwen- 
dig, wenn sich ein Konzept geändert hat. Auch muss in diesem Fall nur das 
geänderte Konzept neu bewertet sowie die Gesamtsumme aller Konzept- 
komplexitätswerte neu berechnet werden. 


7.5.3 Aufwandsabschätzung der 
Modellkorrespondenzbewertung 


Zur Berechnung der Modellkorrespondenz muss bei einer probabilistischen 
Repräsentant-zu-Konzept Zuordnung für jeden Repräsentanten r € R und 
jedes Konzept c € € ihre Korrespondenz bewertet werden. Dazu müssen 
die attributbasierten Korrespondenzwerte für alle Attribute a”! € A, des 
Repräsentanten zu den korrespondierenden Konzept-Attributen bestimmt 
werden. Zur Berechnung dieser Korrespondenzwerte durch die genannten 
Bewertungsmaße müssen die Wahrscheinlichkeiten eines Repräsentanten- 
Attributs und eines Konzept-Attributs für jedes Element ihres Wertebereichs 
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betrachtet und verrechnet werden. Somit ergibt sich eine Zeitkomplexitat 
von O(|R|-|C| - |Aé] - |Sg]) für die Berechnung der Modellkorrespondenz. 


Der für die Diskretisierung stetiger Attribute zusätzlich anfallende Diskre- 
tisierungsaufwand von O ((|R| + |E]) - [AZ]: |S% |) erhöht die Zeitkomple- 
xität der Modellkorrespondenz nicht weiter. Die Wahrscheinlichkeitswerte 
der Repräsentant-zu-Konzept Zuordnung werden als gegeben angenommen. 


Eine Neuberechnung der einzelnen Korrespondenzwerte zwischen Reprä- 
sentanten und Konzepten ist immer dann notwendig, wenn sich ein Reprä- 
sentant, ein Konzept oder deren gemeinsame Zuordnungswahrscheinlich- 
keit ändert. Werden pro Zeitschritt z.B. nur die (bzw. der) von einer Beob- 
achtung betroffenen Repräsentanten aktualisiert, so müssen in der Gesamt- 
summe nur deren Korrespondenzwerte zu allen Konzepten neu berechnet 
und mit den aktualisierten Zuordnungswerten gewichtet werden. 


7.6 Demonstration und Evaluation 


In diesem Abschnitt wird die Evaluation und Demonstration des in dieser Ar- 
beit entwickelten Ansatzes zur quantitativen Bewertung eines Hintergrund- 
wissensmodells beschrieben. Ein Ziel ist es dabei, die prinzipielle Anwend- 
barkeit der definierten Maße für Modellkomplexität und Modellkorrespon- 
denz zu demonstrieren. Dabei soll auch gezeigt werden, dass die Maße die 
für ihren Entwurf beabsichtigten Eigenschaften besitzen. Dies erfolgt in den 
Abschnitten 7.6.1 und 7.6.2. Dabei werden die unterschiedlichen genann- 
ten attributbasierten Korrespondenzmaße anhand eines Beispiels miteinan- 
der verglichen und in Bezug auf ihre Eigenschaften bewertet. Abschließend 
wird in Abschnitt 7.6.3 die quantitative Modellbewertung an einem einfa- 
chen Beispielszenario gesamthaft demonstriert. Zu diesem Zweck wird das 
in Abschnitt 6.3.2 definierte Demonstrationsszenario wiederverwendet. Die 
in diesem Kapitel dargestellten Ergebnisse wurden in [Kuw13a] veröffent- 


licht. 
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7.6.1 Modellkomplexität 


Zunächst soll die Anwendbarkeit der Bewertung der Modellkomplexität de- 
monstriert werden. Dabei stehen zwei Aspekte im Vordergrund. Einerseits 
soll die prinzipielle Anwendbarkeit der beiden definierten Maße L,(a**) in 
(7.5) und L,(a°*) in (7.6) zur Bewertung der Attributkomplexitat an einem 
Beispiel demonstriert werden. Andererseits soll gezeigt werden, dass diese 
Maße die beschriebene Intuition und vorgestellte Annahme über die höhe- 
re Komplexität von spezifischeren Attributverteilungen wie gewünscht um- 
setzen. Darüber hinaus sollen die beiden Maße auch an einem konkreten 
Beispiel verglichen werden. 


Bewertung der Attributkomplexität 


Zur Demonstration der vorgeschlagenen Bewertungsmaße für die Attri- 
butkomplexität werden ähnlich wie in Kapitel 6 einfache Konzepte aus der 
Haushaltsdomäne verwendet, z.B. ein Apfel-Konzept. Die Konzepte werden 
dabei wieder über ein stetiges Längenattribut und ein diskretes Farbattribut 
beschrieben. Zusätzlich zum Apfel-Konzept wird ein allgemeineres Konzept 
betrachtet. Dieses Konzept könnte dem Apfel-Konzept in einer „is-a“- 
Hierarchie als Vaterkonzept übergeordnet sein. Es ergibt sich hier konkret 
als die Summe aus dem Apfel-Konzept und einem Kokosnuss-Konzept und 
wird daher als Apfel-Kokosnuss bezeichnet. Tabelle 7.1 stellt die Definitionen 
dieser Konzepte dar. Der Wertebereich des Farbattributs besteht dabei aus 
den sieben Symbolen w (weiß), b (blau), gr (grün), ge (gelb), o (orange), r 
(rot) und br (braun). In der Tabelle sind jeweils nur die Farbwerte angegeben, 
welche eine von 0 verschiedene Wahrscheinlichkeit besitzen. 


Tabelle 7.1: Beispielhafte Konzepte mit zwei Attributen zur Evaluation der Bewertungsmaße 
für die Konzeptkomplexität. 


Konzept Länge/cm Farbe 


Apfel N(7,12) r: 0.50, gr: 0.30, ge: 0.2 
Apfel-Kok. (N(7,1?) + N(18,4*))/2  r: 0.25, gr: 0.15, ge: 0.1, br: 0.5 
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Die Ergebnisse der Anwendung der Bewertungsmaße für die Attributkom- 
plexität sind in Tabelle 7.2 dargestellt. Zum Vergleich ist für jedes Attribut 
ebenfalls die Entropie H( - ) der Attributverteilung dargestellt. Die Ergebnis- 
se für das stetige Längenattribut basieren auf einer vorherigen Diskretisie- 
rung seiner Wahrscheinlichkeitsverteilung, wie in Abbildung 7.1 illustriert. 
Als kleinster unterscheidbarer Betrag wurde hier ein Wert von A = 1cm 


verwendet mit einem Wertebereich von 0-50 cm. 


Tabelle 7.2: Ergebnisse der Bewertung der Attributkomplexität durch die beiden vorgeschla- 
genen Bewertungsmaße für die diskreten und stetigen Attribute aus Tabelle 7.1. 


Attribut a®' L,(a™) L, (a) H( a ) 
Farbe (Apfel) 0.92 0.47 1.03 
Farbe (Apfel-Kokos.) 0.74 0.38 1.21 
Lange4=!™ (Apfel) 2.45 0.63 1.46 
Lange4=!™ (Apfel-Kokos.) 1.13 0.29 2.78 


Anhand der Ergebnisse wird deutlich, dass die vorgeschlagenen Bewer- 
tungsmaße anwendbar sind. Für das Bewertungsmaß L,(-) ergeben sich wie 
gewünscht auf das Intervall [0,1] skalierte Werte. Das Bewertungsmaß L; (-) 
ist dagegen unbeschränkt. Die Werte für das diskrete Farbattribut und das 
diskretisierte stetige Längenattribut liegen dabei in der gleichen Größenord- 
nung. Wichtig ist die Tatsache, dass die Werte der Bewertungsmaße für das 
spezifischere Apfel-Konzept für beide Attribute höher ausfallen als die Werte 


20 +P) Apfel-Kokosnuss PO) Apfel-Kokosnuss 
15 
10 D-1 
id Lange/m Wt Lange/m 
á 01 p 0.2 p 0.3 0.4 0.5 = 0.1 0.2 0.3 04 05 


(a) Stetige Verteilung (b) Diskretisierte Verteilung 

Abbildung 7.1: Beispiel für die Diskretisierung eines stetigen Attributs unter Verwendung ei- 
nes kleinsten unterscheidbaren Betrags A. Dargestellt ist das Längenattribut 
des Apfel-Kokosnuss-Konzepts aus Tabelle 7.1 und seine Diskretisierung mit 
A=1cm. 
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fiir das allgemeinere, weniger spezifische Apfel-Kokosnuss-Konzept. Die vor- 
geschlagenen Maße entsprechen somit wie beabsichtigt der beschriebenen 
Intuition, dass spezifischere Attribute als komplexer zu bewerten sind. 


Bewertung der Konzeptkomplexität 


Für die beiden betrachteten Konzepte ergeben sich unter Anwendung des 
attributbasierten Komplexitätsmaßes L,(-) die folgenden Komplexitätswer- 
te: Das Apfel-Konzept besitzt eine Komplexität von L (Apfel) = 3.37, das 
Apfel-Kokosnuss-Konzept eine Komplexität von L (Apfel-Kokosnuss) = 1.87. 
Auch hier wird die höhere Komplexität des Apfel-Konzepts deutlich. 


7.6.2 Modellkorrespondenz 


Nach der Modellkomplexität wird nun die Modellkorrespondenz betrach- 
tet. Auch hier soll die prinzipielle Anwendbarkeit des entwickelten Ansat- 
zes demonstriert werden. Weiterhin sollen Maße zur Bewertung der Attri- 
butkorrespondenz evaluiert und verglichen werden, darunter die relative 
Entropie (KL Divergenz), die Kreuzentropie sowie das vorgeschlagene dis- 
krete skalierte Überdeckungsmaß (7.11). Bei der Evaluation dieser Maße ist 
auch die Frage wichtig, wie sehr die Maße zur Quantifizierung des zusätzli- 
chen Beschreibungsaufwands geeignet sind, welcher benötigt wird, um ein 
Repräsentanten-Attribut zu beschreiben, wenn ein Konzept-Attribut als Mo- 


dell gegeben ist. 


Vergleich und Evaluation der attributbasierten Korrespondenzmaße 


In Abbildung 7.3 sind Ergebnisse für die Evaluation der betrachteten at- 
tributbasierten Korrespondenzmaße dargestellt. Die drei gezeigten Maße 
wurden dabei auf ein gegebenes diskretes Konzept-Attribut und ein va- 
riabel positioniertes diskretes Repräsentanten-Attribut angewendet. Die 
Verteilung des Konzept-Attributs ist in Abbildung 7.2a dargestellt, die 
des Repräsentanten-Attributs in Abbildung 7.2b. Zur Evaluation wird die 
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b 3 pt) Konzept-Attribut 
b.2 
0.1 

1 3 5 7 9 11 13 15 1719 


(a) Beispielhaftes diskretes 
Konzept-Attribut 


0.6 pt.) Repräsentanten-Attribut 


0.1 = 


1 3 5 7 9 11 13 15 17 19 


(b) Beispielhaftes diskretes 
Repräsentanten-Attribut 


Abbildung 7.2: Zur Evaluation der attributbasierten Korrespondenzmaße genutzte Verteilun- 
gen. Die Verteilung des Repräsentanten-Attributs wird dabei Schritt für Schritt 
nach rechts durch ihren Wertebereich verschoben. 
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1.0; --e-e- © Uberdeckung »-* -e -o-- 
p.g tbo) a Ki 
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0.6 i : 
0.4 
0.2 Verschiebungs- 
vf wert 
o4 i ği i 
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(c) Diskrete Überdeckung 


Abbildung 7.3: Vergleich von drei attributbasierten Korrespondenzmaßen. Die Werte der Kor- 
respondenzmaße in den drei Teilabbildungen werden jeweils für die beiden 
in Abbildung 7.2 dargestellten Attribute berechnet, wobei die Verteilung des 
Repräsentanten-Attributs in 7.2b bei der Berechnung über seinen Wertebereich 
nach rechts verschoben wird. Auf der x-Achse der drei Teilabbildungen ist da- 
her die aktuelle Verschiebung des Repräsentanten-Attributs dargestellt, die y- 
Achse beschreibt jeweils den Wert der relativen Entropie (a), Kreuzentropie (b) 
bzw. des diskreten skalierten Überdeckungsmaßes (c) für die aktuelle Konstel- 
lation der Attribute. 
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Verteilung des Repräsentanten-Attributs variiert, indem sie von links nach 
rechts durch den dargestellten Wertebereich verschoben wird. Für jede 
Verschiebung wird jeweils der Korrespondenzwert zum Konzept-Attribut 
ermittelt, mit allen drei genannten Bewertungsmaßen. 


Die jeweiligen Korrespondenzwerte für diese Verschiebung sind in den Ab- 
bildungen 7.3a, 7.3b und 7.3c dargestellt. Die x-Achse der einzelnen Ab- 
bildungen beschreibt dabei die Verschiebung des Repräsentanten-Attributs, 
welche der Berechnung zugrunde lag. Ein Verschiebungswert vonz.B.x =5 
ist dabei so zu interpretieren, dass das Repräsentanten-Attribut auf die Po- 
sition X, = 5 seines Wertebereichs (in Abbildung 7.2b) verschoben wurde, 
und zwar derart, dass der erste von 0 verschiedene Wert auf x, = 5 liegt 
und der in diesem Fall mittig gelegene Modalwert der Verteilung auf x, = 6. 
Für einen Verschiebungswert von 8 liegen somit die Modalwerte der Ver- 
teilungen von Konzept-Attribut und Repräsentanten-Attribut auf derselben 
Position x, = 9 im Wertebereich der Attribute. Die einzelnen Abbildungen 
stellen die Bewertungsergebnisse für die Attributkorrespondenz durch die 
Maße relative Entropie D (- ||) in 7.3a, Kreuzentropie H(-,-) in 7.3b und 
das diskrete skalierte Überdeckungsmaß L, (-, +) in 7.3c dar. 


Anhand dieser Abbildungen ist zunächst erkennbar, dass alle drei Maße 
prinzipiell geeignet sind, um eine attributbasierte Korrespondenz, und somit 
die zusätzlich notwendige Beschreibungslänge für das Repräsentanten- 
Attribut unter Verwendung des Konzept-Attributs als Modell, zu bewerten. 
Im Detail fallen die Bewertung jedoch unterschiedlich aus in Bezug auf zwei 
Aspekte. Einerseits unterscheiden sich die Größen der Korrespondenzwerte. 
Für das diskrete skalierte Überdeckungsmaß sind die Korrespondenzwerte 
dabei auf das Intervall [0,1] beschränkt, für die anderen beiden Maße ist dies 
nicht der Fall. Der Maximalwert von 1 ergibt sich für das Überdeckungs- 
maß für den Fall, dass beide Attributverteilungen sich nicht überlappen. 
Die Summe der Differenzen in (7.11) und (7.12) gleicht in diesem Fall der 
Summe über die Verteilung des Repräsentanten-Attributs und ergibt somit 
den Wert 1. Das Überdeckungsmaß ist weiterhin das einzige der drei Maße, 
dass die zusätzlich notwendige Beschreibungslänge mit 0 bewertet für 
den Fall, dass das Konzept-Attribut das skalierte Repräsentanten-Attribut 
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komplett überdeckt (Verschiebungswert x = 8). Dies liegt in der Skalierung 
des Repräsentanten-Attributs begründet. Die relative Entropie erreicht für 
diesen Fall einen Wert nahe 0. Beide Maße setzen in diesem Fall und auch 
insgesamt die der Attributkorrespondenz zugrunde liegende Intuition einer 
zusätzlich notwendigen Beschreibungslänge hinreichend gut um. Weiterhin 
ist festzustellen, dass relative Entropie und Kreuzentropie einen glatteren 
Verlauf darstellen, wenn man die sich für jede Verschiebung ergebenden 
Korrespondenzwerte zur einer Kurve verbindet. 


Kombination mit Komplexitätsmaßen 


Als Ergebnis dieser Evaluation lässt sich insgesamt festhalten, dass sowohl 
die relative Entropie als auch das diskrete skalierte Überdeckungsmaß zwei 
geeignete Bewertungsmaße für die Attributkorrespondenz darstellen. Zur 
Gesamtbewertung der Qualität eines Modells müssen die Korrespondenz- 
maße mit den zuvor betrachteten Komplexitätsmaßen kombiniert werden. 
Hier eignet sich die relative Entropie als attributbasiertes Korrespondenz- 
maß gut, um zusammen mit dem unbeschränkten attributbasierten Komple- 
xitätsmaß L}(-) eingesetzt zu werden. Das diskrete skalierte Uberdeckungs- 
maß eignet sich aufgrund seines beschränkten Wertebereichs dagegen gut, 
um zusammen mit dem normalisierten attributbasierten Komplexitätsmaß 
L,(-) eingesetzt zu werden. 


7.6.3 Evaluation an einem einfachen Beispielszenario 


Nach der individuellen Betrachtung der Bewertungsmaße für Modellkom- 
plexität und Modellkorrespondenz sowie der Demonstration ihrer grund- 
sätzlichen Anwendbarkeit soll der Ansatz der quantitativen Modellbewer- 
tung ganzheitlich anhand eines Beispielszenarios demonstriert und evalu- 
iert werden. Zu diesem Zweck wird das bereits in Abschnitt 6.3.2 vorgestell- 
te einfache Demonstrationsszenario aus dem Bereich der Haushaltsdomäne 
wiederverwendet. Als Hintergrundwissen dient daher wieder die Menge der 
Konzepte € = {Apfel, Banane, Kokosnuss}. Diese Konzepte wurden in Tabelle 
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6.1 definiert. Der Ubersicht halber werden die Attributwerte dieser Konzep- 
te in Tabelle 7.3 nochmals zusammengefasst. Jedes der Konzepte wird dabei 
über ein diskretes Farbattribut und ein stetiges Längenattribut beschrieben. 


Für die Demonstration der quantitativen Modellbewertung wird ein sich 
zeitlich ändernder Inhalt des Weltmodells angenommen. Im Demonstrati- 
onsszenario werden daher zu verschiedenen Zeitpunkten unterschiedliche 
Entitäten in der Umgebung beobachtet, welche dann in Form von Reprä- 
sentanten im Weltmodell dargestellt werden. Im Szenario werden dabei nur 
diejenigen Zeitschritte betrachtet, in denen neue Repräsentanten ins Welt- 
modell aufgenommen werden. Dabei wird zu Demonstrationszwecken ver- 
einfachend angenommen, dass Beobachtungen zu anderen Zeitpunkten kei- 
ne für die Modellbewertung relevanten Änderungen an den Repräsentanten 
bewirken. Beispielsweise können Beobachtungen zu solchen Zeitpunkten 
nur Änderungen an den zustandsbezogenen Attributen beobachteter Reprä- 
sentanten betreffen. Die Repräsentanten des Szenarios entsprechen den in 
Tabelle 6.2 für das einfache Demonstrationsszenario definierten Repräsen- 
tanten. Der Übersicht halber werden auch die Repräsentanten nochmals in 
Tabelle 7.4 zusammengefasst. Weiterhin wird für jeden Repräsentanten auch 
der Zeitpunkt im Szenario angegeben, zu welchem dieser dem Weltmodell 
hinzugefügt wird. Die Reihenfolge der Repräsentanten in der Tabelle ent- 
spricht dabei der Reihenfolge ihres Auftretens im Szenario. 


Tabelle 7.3: Konzepte im Hintergrundwissen C im einfachen Demonstrationsszenario (Zusam- 
menfassung von Tabelle 6.1). 


Name Länge/cm Farbe 


Apfel N(9,17) grün-gelb-rot (3:2:5) 
Banane N (18,27) grün-gelb-braun (1:5:1) 
Kokosnuss N (16 5 1.5?) braun 
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Tabelle 7.4: Im Demonstrationsszenario betrachtete Repräsentanten in der Reihenfolge und 
mit dem Zeitpunkt ihres Auftretens. Die Repräsentanten werden dabei über ein 
stetiges Längenattribut sowie ein diskretes Farbattribut beschrieben (Erweiterung 
zu Tabelle 6.2). 


Name Länge/cm Farbe Zeit 
Apfell N(8,0.5?) grün-gelb (1:1) 2 
Apfel2 N(7,0.27) rot 3 
Kokosnuss1 N(15 ,0.757) braun 4 
Birne1 N(13,0.27)  grün-gelb (3:1) 5 
Erdbeere1 N(3.5 ; 1’) rot 6 


Die Ergebnisse der quantitativen Modellbewertung in diesem Demonstrati- 
onsszenario sind in Abbildung 7.4 dargestellt. Dabei wird sowohl das Ge- 
samtmaß für die Modellgüte Q(R, C) als auch der reine Anteil der Modell- 
korrespondenz L(R|C) gezeigt. Die Modellkomplexität L (C) ergibt sich 
indirekt als Differenz der beiden Maße. Zur Interpretation der gezeigten 
Verläufe ist anzumerken, dass die Modellgüte nach dem gewählten MDL- 
basierten Ansatz in Form einer Beschreibungslänge dargestellt wird. Je grö- 
Ber diese Beschreibungslänge ist, desto geringer ist die Qualität des Modells. 
Kleinere Werte für die Modellgüte Q(R, C ) sind somit erstrebenswert, da sie 
eine bessere Qualität beschreiben. 


Das betrachtete Demonstrationsszenario läuft wie nachfolgend beschrieben 
ab. Im ersten Schritt des Szenarios (k = 1) ist noch kein Repräsentant im 
Weltmodell enthalten. Der gezeigte Wert des Gesamtmaßes für die Modell- 
güte entspricht in diesem Zeitschritt somit der Modellkomplexität, d. h. der 
kumulierten Komplexität der drei Konzepte Apfel, Banane und Kokosnuss. 
In den nächsten zwei Zeitschritten (k = 2 und k = 3) wird jeweils ein 
Apfel-Repräsentant dem Weltmodell hinzugefügt (Apfel1, Apfel2), und da- 
nach (k = 4) ein Kokosnuss-Repräsentant (Kokosnuss1). Das moderate An- 
steigen der Bewertungsmaße mit dem Korrespondenzwert repräsentiert in 
diesen Schritten daher die pro Repräsentant über das Hintergrundwissen 
hinausgehend notwendige Beschreibungslänge. In den Zeitschritten k = 5 
und k = 6 werden Repräsentanten zum Weltmodell hinzugefügt, für welche 
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— Modellgüte Q(R,C) 
— Modellkorrespondenz L(R |C) 
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Abbildung 7.4: Entwicklung zweier Bewertungsmaße der quantitativen Modellbewertung im 
betrachteten einfachen Demonstrationsszenario über sieben Zeitschritte. Klei- 
nere Werte für die gezeigte Gesamtgüte Q(R, €) eines Modells stellen dabei 
eine bessere Modellqualität dar. Als ein Anteil der Modellgüte beschreibt die 
Modellkorrespondenz L(R | €), wie viel zusätzlicher Beschreibungsaufwand 
notwendig ist, um die Repräsentanten im Weltmodell darstellen zu können, 
wenn als Modell die Konzepte des Hintergrundwissens genutzt werden. In den 
Zeitschritten 2-6 wird jeweils ein neuer Repräsentant aus Tabelle 7.4 ins Welt- 
modell eingefügt. Für die in den Zeitschritten 5-6 eingefügten Repräsentan- 
ten sind dabei keine Konzepte im Hintergrundwissen enthalten, daher steigen 
die Werte der Bewertungsmaße stärker an. Zeitschritt 7 demonstriert, wie das 
Hinzufügen eines neuen Konzepts zu einer Verbesserung der Modellgüte über 
eine verbesserte Modellkorrespondenz führen kann. 


keine passenden Konzepte im Hintergrundwissen modelliert sind: eine Bir- 
ne (Birne1) und einer Erdbeere (Erdbeere1). Dies führt jeweils zu einer deutli- 
chen Verschlechterung der Modellqualität durch die nun zusätzlich notwen- 
dige Beschreibung, dargestellt über den jeweiligen Korrespondenzwert. 


Die Modellqualität kann verbessert werden, wenn für die bisher nur schlecht 
beschriebenen Repräsentanten neue Konzepte erzeugt und dem Hinter- 
grundwissen hinzugefügt werden. Dies wird im letzten Zeitschritt (k = 7) 
des Demonstrationsszenarios simuliert, indem die Menge € um ein Konzept 
Birne erweitert wird. Dies führt zu einem reduzierten Korrespondenzwert 
und somit zu einer verbesserten Modellqualität. Die Modellqualität verbes- 
sert sich allerdings nicht im gleichen Umfang wie der Korrespondenzwert, 
da in die Berechnung der Modellgüte zusätzlich noch die Modellkomplexität 
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mit eingeht. Das Hinzufiigen eines neuen Konzepts zum Hintergrundwissen 
führt zu einer erhöhten Modellkomplexitat. 


Die Berechnung der Bewertungsmaße im Demonstrationsszenario erfolgt 
unter Verwendung des attributbasierten Komplexitätsmaßes L,(a§ ) (7.5) 
für die Modellkomplexität. Das stetige Längenattribut wird dabei unter 
Verwendung eines kleinsten unterscheidbaren Betrags A = 1cm und für 
einen Wertebereich von 0-50 cm diskretisiert. Die Berechnung der Modell- 
korrespondenz erfolgt unter Verwendung der diskreten relativen Entropie 
als attributbasiertes Korrespondenzmaß. Als Vorverarbeitungsschritt wird 
dabei das jeweilige Repräsentanten-Attribut über den für das diskrete Über- 
deckungsmaß beschriebenen Skalierungsansatz mit dem Faktor y (a'*, as 
(vgl. (7.11)) multipliziert. Für die Berechnung der erwarteten Konzeptkorre- 
spondenz wird eine probabilistische Repräsentant-zu-Konzept Zuordnung 
nach Gleichung (6.7) verwendet. Die sich ergebenden Zuordnungswahr- 
scheinlichkeiten für die betrachteten Repräsentanten sind dabei bereits 
als Ergebnisse in Kapitel 6 dargestellt (mit Ausnahme des Repräsentanten 
Apfel2, für welchen sich eine Zuordnung zum Konzept Apfel ergibt). 


7.7 Zusammenfassung 


In diesem Kapitel wurde ein Ansatz zur quantitativen Bewertung eines Hin- 
tergrundwissensmodells vorgestellt. Ein solche Bewertung ist dabei eine 
wichtige Aufgabe innerhalb der adaptiven Umweltmodellierung. Die aktuel- 
le Güte eines Hintergrundwissensmodells kann dabei im Speziellen als eine 
übergeordnete Steuergröße für die adaptive Wissensverwaltung dienen. 


Der vorgestellte Ansatz zur quantitativen Modellbewertung basiert auf 
dem Prinzip der minimalen Beschreibungslänge als Informationskriterium 
und besteht aus zwei Anteilen. Dabei wird als erster Anteil zunächst die 
Komplexität eines Modells bewertet. Zu diesem Zweck wurde ein kumulie- 
rendes Maß über den Konzepten des Hintergrundwissensmodells definiert. 
In diesem Maß wird die Komplexität eines Konzepts als eine Summe über 
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der Spezifität seiner Attribute berechnet. Die Spezifität einer Attributvertei- 
lung ergibt sich unter Verwendung der Shannon’schen Entropie. Neben der 
Komplexität wird als zweiter Anteil die Korrespondenz der Repräsentanten 
des Weltmodells zu den modellierten Konzepten im Hintergrundwissen 
bewertet. Auch zu diesem Zweck wurde ein kumulierendes Maß definiert. 
Als Basisgröße der Bewertung wird hier die Korrespondenz zwischen 
einem Repräsentanten-Attribut und dem korrespondierenden Konzept- 
Attribut betrachtet. Diese Korrespondenz wird durch einen Vergleich ihrer 
Attributverteilungen bewertet. Ein Bewertungsmaß beschreibt in diesem 
Fall, wie viel zusätzliche Beschreibung zur Darstellung der Verteilung 
des Repräsentanten-Attributs notwendig ist, wenn das korrespondier- 
ende Konzept-Attribut als Modell zugrunde gelegt wird. Als ein solches 
Bewertungsmaß kann z.B. die relative Entropie eingesetzt werden. 


Die für die quantitative Modellbewertung definierten und vorgeschlagenen 
Bewertungsmaße wurden anschließend anhand von ausgewählten Beispie- 
len in ihrer prinzipiellen Anwendbarkeit evaluiert und demonstriert. Eben- 
falls wurde eine gesamthafte Evaluation des Ansatzes an einem einfachen 
Beispielszenario durchgeführt und beschrieben. 


310 


8 Adaptive Verwaltung von 
Hintergrundwissensmodellen 


8.1 Überblick 


In Abschnitt 3.2.2 wurden die Teilaufgaben der adaptiven Umweltmodellie- 
rung im Überblick genannt. Eine wichtige Teilaufgabe ist dabei die quanti- 
tative Modellbewertung, für welche in Kapitel 7 entsprechende Maße vorge- 
stellt wurden. Die quantitative Modellbewertung ermöglicht es, eine abneh- 
mende Modellgüte und somit zugleich den Bedarf für eine Modellanpassung 
festzustellen. Die Durchführung einer solchen Modellanpassung fällt in den 
Aufgabenbereich der adaptiven Modellverwaltung. Die adaptive Modellver- 
waltung stellt dabei das Analogon der Hintergrundwissens-Komponente zur 
Informationsverwaltung in der Weltmodell-Komponente dar. In der adapti- 
ven Modellverwaltung werden alle Aufgaben zusammengefasst, welche da- 
zu dienen, ein Hintergrundwissensmodell bei abnehmender Güte in Bezug 
auf die in der Umgebung beobachtete Situation adaptiv zu verbessern. Sie 
stellt somit einen Gesamtansatz zur Umsetzung der bisher für die adapti- 
ve Umweltmodellierung beschriebenen Konzepte dar. Analog zur Informa- 
tionsverwaltung im Weltmodell zeichnet sich die adaptive Wissensverwal- 
tung durch ein übergeordnetes Verarbeitungsschema aus, nach welchem sol- 
che Modellanpassungen für ein objektorientiertes Umweltmodell durchge- 
führt werden. Methodisch baut die adaptive Modellverwaltung auf der quan- 
titativen Modellbewertung auf, indem zur Durchführung ihrer Aufgaben die 
dort definierten Bewertungsmaße genutzt werden, sowie auf der in Kapitel 
6 beschriebenen Repräsentant-zu-Konzept Zuordnung. 


8 Adaptive Verwaltung von Hintergrundwissensmodellen 


Eine der Aufgaben der adaptiven Modellverwaltung ist es, die Datengrund- 
lage bereitzustellen, auf welcher Modellanpassungen erfolgen können. Dazu 
müssen Repräsentanten im Weltmodell detektiert und identifiziert werden, 
welche nur schlecht von den bisher im Hintergrundwissen enthaltenen Kon- 
zepten beschrieben werden. Zu diesem Zweck nutzt die adaptive Modell- 
verwaltung Detektionsmaße, welche in Abschnitt 8.2 beschrieben werden. 
Die Darstellungen basieren dabei auf [Kuw13b], wenn nicht anders ange- 
geben. Da Modellanpassungen in der adaptiven Umweltmodellierung prin- 
zipiell bedarfsgerecht und relevanzbezogen erfolgen, ist eine bloße Detek- 
tion von schlecht beschriebenen Repräsentanten in einem Zeitschritt nicht 
ausreichend. In der objektorientierten Umweltmodellierung wird pro Zeit- 
schritt die Beobachtung einer Entität der Umgebung verarbeitet (vgl. Ab- 
schnitt 5.1.1). Somit kann pro Zeitschritt maximal ein neuer Repräsentant 
ins Weltmodell aufgenommen werden und ggf. einen schlecht beschriebe- 
nen Repräsentanten darstellen. Für die adaptive Umweltmodellierung wird 
daher die Annahme getroffen, dass die Relevanz einer Entität bzw. eines 
Typs von Entität für das objektorientierte Umweltmodell mit der Häufigkeit 
ihres Auftretens korreliert. Ist ein Objekt beispielsweise für eine Aufgabe 
des kognitiven Systems relevant, so wird es häufig von diesem beobach- 
tet werden, um z.B. mehr oder aktuellere Informationen über das Objekt 
erwerben zu können. Somit stellt ein solches Objekt häufig das in einem 
Zeitschritt beobachtete Objekt dar. Um diesen Annahmen entsprechend die 
Relevanz von angetroffenen schlecht beschriebenen Repräsentanten beur- 
teilen zu können, muss somit über ihr Auftreten im Verlauf der Zeit Buch 
geführt werden. Eine solche Verwaltung von schlecht beschriebenen Reprä- 
sentanten wird im Rahmen von Abschnitt 8.3 vorgestellt. 


Wird durch eine übergeordnete Bewertung der Bedarf für eine Modellan- 
passung festgestellt, so muss als nächstes der Ausgangspunkt für eine sol- 
che Anpassung bestimmt werden. Dazu werden die verwalteten schlecht be- 
schriebenen Repräsentanten betrachtet und untersucht. Ziel dieser Untersu- 
chung ist es, eine Menge von relevanten Repräsentanten zu identifizieren, 
welche zu einer möglichst großen Verbesserung der Modellgüte führt, wenn 
die enthaltenen Repräsentanten als Lernbeispiele für ein neues, dem Modell 
hinzuzufügendes Konzept dienen. Das Vorgehen zur Auswahl einer solchen 
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Menge von schlecht beschriebenen Repräsentanten als Lernbeispiele wird 
in Abschnitt 8.3.2 beschrieben. Ist eine Menge von Lernbeispielen gegeben, 
so können Modellanpassungen durchgeführt werden. Dazu muss zunächst 
entschieden werden, ob ein gänzlich neues Konzept gelernt oder ein existie- 
rendes Konzept angepasst werden soll. Anschließend können die entspre- 
chenden Modellanpassungen durchgeführt werden. Diese Aspekte werden 
in den Abschnitten 8.3.3 und 8.4 beschrieben. Bevor neue Änderungen in 
ein Hintergrundwissensmodell übernommen werden, wird zunächst durch 
die quantitative Modellbewertung die Güte des geänderten Modells vorher- 
gesagt. Verbessert sich durch die Anpassung die Modellgüte, so wird diese 
Anpassung ins Hintergrundwissen übernommen. 


Das Verarbeitungsschema, welches den eben genannten Schritten zugrunde 
liegt, wird in Abschnitt 8.3.1 vorgestellt. Zur Demonstration und Evaluati- 
on des vorgestellten Ansatzes der adaptiven Wissensverwaltung sowie der 
Anteile der adaptiven Umweltmodellierung insgesamt wird in Abschnitt 8.5 
schließlich ein komplexeres Anwendungsszenario betrachtet. Für dieses Sze- 
nario werden probabilistische Konzepte definiert. 


8.2 Detektion von schlecht beschriebenen 
Repräsentanten 


Ist die anhand der quantitativen Modellbewertung bestimmte Güte eines 
Hintergrundwissensmodells nicht ausreichend für das objektorientierte Um- 
weltmodell, so bedeutet dies zugleich, dass im Weltmodell Repräsentanten 
vorhanden sein müssen, welche nicht ausreichend gut durch die Konzepte 
des Hintergrundwissens beschrieben werden. Solche schlecht beschriebenen 
Repräsentanten müssen nun durch eine Modellanpassung adressiert werden. 
Sie stellen somit den Ausgangspunkt von Modellanpassungen dar. Daher ist 
es für eine adaptive Umweltmodellierung notwendig, solche Repräsentanten 
im Weltmodell zu identifizieren bzw. zu detektieren. 
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Zur Detektion miissen das Weltmodell bzw. ein spezifischer Reprasentant 
sowie die Konzepte des Hintergrundwissens betrachtet und verglichen wer- 
den. Ein solcher Vergleich sollte auch beriicksichtigen, zu welchem Zweck 
und auf welche Weise die modellierten Konzepte in der objektorientierten 
Umweltmodellierung genutzt werden, wie z.B. zur semantischen Vervoll- 
ständigung von Repräsentanten. Ein nahe liegendes Vorgehen ist es daher, 
diesen Vergleich auf Basis der bisher genutzten Maße vorzunehmen, z.B. 


« der Repräsentant-zu-Konzept Zuordnung oder 


« der Korrespondenzmaße der quantitativen Modellbewertung. 


Dabei lassen sich grundsätzlich zwei Arten von Ansätzen unterscheiden. 
Globale Ansätze wie die quantitative Modellbewertung betrachten und 
bewerten dabei alle Repräsentanten des Weltmodells kumulativ. Weiterhin 
können hier auch unterschiedliche Zustände des Weltmodells über die Zeit 
betrachtet werden, unter Verwendung der gespeicherten Historie. Lokale 
Ansätze berücksichtigen dagegen immer nur den aktuellen Zeitpunkt und 
betrachten jeden Repräsentanten individuell. 


8.2.1 Globale Ansätze zur Detektion 


Ein erster Ansatz, um schlecht beschriebene Repräsentanten zu erkennen, 
basiert auf der Gütebewertung des Gesamtmodells in Verbindung mit der 
Annahme, dass im objektorientierten Umweltmodell in jedem Zeitschritt 
nur maximal ein neuer Repräsentant ins Weltmodell aufgenommen wer- 
den kann. Ändert sich somit in einem Zeitschritt, in welchem ein neuer Re- 
präsentant ins Weltmodell aufgenommen wird, die Gesamtgüte des Modells 
maßgeblich, so kann dies dem neu erzeugten Repräsentanten zugeschrie- 
ben werden. Unter dieser Annahme können dann die Maße der quantitati- 
ven Modellbewertung als globale Detektionsmaße für schlecht beschriebe- 
ne Repräsentanten eingesetzt werden. Hierbei ist allerdings nur der Anteil 
der Modellkorrespondenz L (R | € ) am Gesamtmaß relevant, da die Modell- 
komplexität rein die Konzepte betrachtet. 
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Ein allgemeiner Ansatz für ein solch globales, korrespondenzbasiertes De- 
tektionsmaß M Ai - ) für den Zeitpunkt t, kann also als 


M,( Ron C) := SLR, IE), ER, |E), LR €)) (6-1) 


formuliert werden, wobei g(-) eine aggregierende Funktion tiber die Modell- 
korrespondenzwerte der einzelnen Zeitpunkte fo, t4, ...,t, darstellt. 


Als ein einfaches Detektionsma8 kann die Anderung der Modellkorrespon- 
denz von einem Zeitschritt auf den nächsten betrachtet werden. Hierzu kann 
die Aggregationsfunktion g7(-) definiert werden als 


Diese Funktion beschreibt die absolute Änderung des Modellkorrespondenz- 
maßes (d. h. der notwendigen Beschreibungslänge) für die im aktuellen Zeit- 
schritt beobachtete Entität. Wird ein neuer Repräsentant dem Weltmodell 
hinzugefügt, so steigt der Wert des Modellkorrespondenzmaßes an. Für ak- 
tualisierte Repräsentanten kann der Wert auch sinken. Die Grundannahme 
bei diesem Maß ist, dass für einen schlecht beschriebenen neuen Repräsen- 
tanten ein größerer Anstieg stattfindet und dies über einen Schwellwert de- 
tektiert werden kann. Die Größe eines solchen Schwellwerts festzulegen, ist 
allerdings nicht einfach, da die Werte der Korrespondenzmaße von den kon- 
kreten Attributen eines Anwendungsfalls abhängen. Dies betrifft die Anzahl, 
Wertebereiche sowie die mögliche Diskretisierung der Attribute. 


Um die Definition eines solchen Schwellwerts zu vereinfachen, können wei- 
tere Annahmen getroffen werden. So kann z.B. angenommen werden, dass 
ein a priori erstelltes Wissensmodell im Regelfall die in der Umgebung beob- 
achteten Entitäten beschreiben kann und schlecht beschriebene Repräsen- 
tanten nur die Ausnahme darstellen. Unter dieser Annahme lässt sich die 
erwartete Zunahme der Modellkorrespondenz pro Zeitschritt für den Fall be- 
stimmen, dass kein schlecht beschriebener Repräsentant auftritt. Dies kann 
z.B. approximativ durch eine Mittelung der Änderungswerte über die bis- 
herige Betriebszeit des Umweltmodells erfolgen. Diese erwartete Zunahme 
kann nun als Ausgangspunkt für die Definition eines Schwellwerts genutzt 
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werden. Somit lässt sich ein zweites Detektionsmaß als 


Dray L(R,[C)-L(R,.,| ©) 


gC) := (L (Ri, | C)-E (Rens | e))- PENE] 


(8.3) 


definieren, welches die relative Änderung des Korrespondenzwerts im ak- 
tuellen Zeitschritt gegenüber der bisherigen mittleren Änderung der Korre- 
spondenzwerte pro Zeitschritt bewertet. Für dieses Maß kann ein Schwell- 
wert zur Detektion dann z.B. auf Basis der mittleren Änderung pro Zeit- 
schritt definiert werden. 


8.2.2 Lokale Ansätze zur Detektion 


Als eine Alternative zu Maßen, welche kumulativ alle Repräsentanten des 
Weltmodells betrachten, können auch lokale Detektionsmaße genutzt wer- 
den. Ein lokales Detektionsmaß betrachtet dabei pro Zeitschritt jeweils nur 
den oder die Repräsentanten, welche in diesem Zeitschritt aktualisiert wur- 
den. Auch zur Definition eines lokalen Detektionsmaßes kann auf den be- 
reits vorgestellten Maßen aufgesetzt werden. Zu diesem Zweck kann z.B. 
die Konzeptkorrespondenz eines Repräsentanten zu den Konzepten c € € 
genutzt werden. 


Korrespondenzbasiertes Detektionsmaß 


Unter Verwendung eines skalierten Bewertungsmaßes für die Attributkor- 
respondenz ergibt sich eine Korrespondenz von 0 oder nahe daran für ei- 
nen Repräsentanten, welcher durch ein Konzept gut beschrieben wird. Er- 
gibt sich dagegen über alle Konzepte hinweg kein solcher Wert, so ist der 
Repräsentant schlecht beschrieben. Um das Vorliegen eines solchen Werts 
bewerten zu können, muss ebenfalls ein Schwellwert definiert werden. In 
Abbildung 8.1 sind beispielhaft die Korrespondenzwerte von drei Repräsen- 
tanten zu den Konzepten Apfel, Banane und Kokosnuss, wie in Abschnitt 6.3.2 
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L(r|c) Birnei L(r|c) Apfel L(r|c) Bananel 

15 15 15 

10 10 10 

5 3 5 

"| Apfel Banane Kokos. rt Apfel Banane Kokos. "| Apfel Banane Kokos. 


(a) Schlecht beschriebene (b) Gut beschriebener Apfell (c) Gut beschriebene Bananel 
Birnel 


Abbildung 8.1: Beispielwerte für die Konzeptkorrespondenz für drei Repräsentanten zur Kon- 
zeptmenge C = {Apfel, Banane, Kokosnuss wie in Abschnitt 6.3.2 definiert. Ein 
Korrespondenzwert von nahe O für zumindest eines der Konzepte stellt dabei 
einen gut beschriebenen Repräsentanten dar, wie in den rechten beiden Teil- 
abbildungen (b) und (c) gezeigt. Liegt dagegen kein solcher Wert vor, handelt 
es sich um einen schlecht beschriebenen Repräsentanten, wie in Teilabbildung 


(a) gezeigt. 


definiert, dargestellt. Anhand der Beispielwerte wird deutlich, dass für die- 
ses Maß ein Schwellwert aus einem breiteren Bereich gewählt werden kann. 
Dies gilt bereits, wenn wie im einfachen Beispielszenario nur zwei Attribute 
zur Beschreibung der Konzepte genutzt. Werden dagegen in einem realisti- 
schen Szenario mehr Attribute verwendet, so steigen die Korrespondenzwer- 
te aufgrund der kumulativen Natur des Korrespondenzmaßes für schlecht 
beschriebene Repräsentanten weiter an. Allerdings ist ein Schwellwert auch 
in diesem Fall vom vorliegenden Anwendungsfall abhängig, wieder in Form 
der genutzten Anzahl an Attributen und ihrer Wertebereiche sowie der je- 
weiligen Diskretisierung dieser Attribute. 


Zuordnungsbasiertes Detektionsmaß 


Als Grundlage für ein weiteres Bewertungsmaß kann auch die Repräsentant- 
zu-Konzept Zuordnung genutzt werden. Da diese Zuordnung ebenfalls in- 
dividuell für Repräsentanten berechnet wird, stellt ein solcher Ansatz auch 
ein lokales Maß dar. Die Verwendung des Ergebnisses der Repräsentant-zu- 
Konzept Zuordnung in Form einer diskreten Verteilung über den Konzepten 
des Hintergrundwissens hat dabei den Vorteil, dass diese Verteilung nicht 
mehr von der Anzahl an Attributen und deren Wertebereichen abhängt. 
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Gut beschriebene Repräsentanten zeichnen sich dabei dadurch aus, dass sie 
relativ eindeutig einem Konzept zugeordnet werden können. Für schlecht 
beschriebene Repräsentanten ergibt sich dagegen eine inkonklusive Wahr- 
scheinlichkeitsverteilung. Somit unterscheidet sich in beiden Fällen die Kon- 
zentration der Wahrscheinlichkeitsmasse der Zuordnungsverteilung, entwe- 
der konzentriert auf einem einzelnen Konzept und verteilt über alle Kon- 
zepte. Zur Detektion von schlecht beschriebenen Repräsentanten kann da- 
her ein Konzentrationsmaß über der Zuordnungsverteilung genutzt werden 
wie die Shannon’sche Entropie. Je stärker konzentriert die Wahrscheinlich- 
keitsmasse einer Zuordnung ist, desto besser ist der Repräsentant dabei be- 
schrieben, und desto kleiner ist die Entropie der Zuordnungsverteilung. So- 
mit spiegelt die Differenz der Entropie der Zuordnungsverteilung zur maxi- 
malen Entropie über dem Wertebereich der Verteilung wider, inwiefern ein 
Repräsentant schlecht beschrieben ist. Als Detektionsmaß kann daher die 
relative Entropiedifferenz 


H(p(elr)) 


der Zuordnungsverteilung p(c|r) zur maximal möglichen Entropie log(|C| ) 


M(p(elr)) := (8.4) 


genutzt werden. 


Abbildung 8.2 stellt die Anwendung dieses Maßes auf unterschiedliche Bei- 
spielverteilungen dar. Dabei sind in der ersten Zeile der Abbildung Ver- 
teilungen für schlecht beschriebene Repräsentanten dargestellt und in der 
zweiten Zeile für Repräsentanten, welche eindeutig einem Konzept zuge- 
ordnet werden können. Es ist erkennbar, dass die Werte des Detektionsma- 
Bes sich in beiden Fällen deutlich unterscheiden. Zur Detektion von schlecht 
beschriebenen Repräsentanten kann somit z.B. ein Schwellwert von % 0.5 
genutzt werden. Ein zuordnungsbasiertes Detektionsmaß ist zwar unabhän- 
gig von den Attributen eines Anwendungsfalls, jedoch nicht von der Größe 
|€ | der Konzeptmenge. Dieser Effekt wird ebenfalls in Abbildung 8.2 gezeigt: 
je Spalte variiert dabei die Größe der zugrunde gelegten Konzeptmenge. 
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Pcl)  M(p)=0.008 ptelD _ M(p)=0.127 plc)  M(p)=0.107 
1.0 
1.0 f 1.0 5 
8 10.8 | b.g © 
6 0.6 E 0.6 5 
4 0.4} lo.4 E 
2 0.2 | 0.2 t 
i — = m 
i 1 2 c| r1 2 3 4 5 ég 12345 67 8 9 10111213¢ 
(a) |C| = 2 (SBR) (b) |C] = 6 (SBR) (c) [C| = 13 (SBR) 
pl)  M(p)=2.492 piel M(p)=1.102 pteln  M(p)=7.328 
1.0 dl 1.0 
B 0.8 | log E 
6 0.6 F 0.6 
4 0.4 | 0.4 
2 0.2 F 0.2 
pT =] |) |] 
1 2 c| =. 2 3 4 5 6 c 12345678 910111213¢ 
(d)|C| =2 (e)|C| = 6 (f) |e] = 13 


Abbildung 8.2: Beispielhafte Werte für das zuordnungsbasierte Detektionsmaß M(p(c|r)) 
für schlecht beschriebene Repräsentanten (SBR). In der ersten Zeile sind Bei- 
spiele für Zuordnungsverteilungen von schlecht beschriebenen Repräsentan- 
ten und die entsprechenden Werte des Detektionsmaßes gegeben. Die zweite 
Zeile stellt Verteilungen für Repräsentanten dar, welche einem der Konzepte 
des Hintergrundwissens zugeordnet werden können. In beiden Fälle werden 
unterschiedliche Größen |C| der zugrunde gelegten Konzeptmenge und der 
Effekt auf das Detektionsmaß betrachtet. 


Rückweisungsklassen 


Eine einfache Möglichkeit, schlecht beschriebene Repräsentanten bereits 
bei der Berechnung der Zuordnungsverteilung zu erkennen, stellen Rück- 
weisungsklassen dar. Eine Rückweisungsklasse wird dabei einem Reprä- 
sentanten im Ausnahmefall zugeordnet, wenn ihm keines der Konzepte des 
Hintergrundwissens zugeordnet werden kann. Unterstützt ein Verfahren 
zur Berechnung der Repräsentant-zu-Konzept Zuordnung als ein mögliches 
Ergebnis auch eine Rückweisung, so kann dies zur Erkennung von schlecht 
beschriebenen Repräsentanten genutzt werden. Für die in Abschnitt 6.4.2 
beschriebene erweiterte alternative Repräsentant-zu-Konzept Zuordnung 
könnte eine solche Rückweisung umgesetzt werden für den Fall, dass an- 
hand des Schwellwertvergleichs zum Basiswert für einen Repräsentanten 
nur insignifikante Ähnlichkeiten zu allen Konzepten festgestellt werden. 
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Eine solche Rückweisung stellt allerdings eine harte Entscheidung im Sinne 
eines deterministischen Werts dar. Da in der objektorientierten Umweltmo- 
dellierung eine probabilistische Informationsverarbeitung im Vordergrund 
steht, wurde dieser Ansatz nicht tiefergehend betrachtet. 


8.2.3 Untersuchung und Erweiterung des 
zuordnungsbasierten Detektionsmaßes 


Wie in Abbildung 8.2 deutlich wird, kann das zuordnungsbasierte Detekti- 
onsmaß M(-) sehr unterschiedliche Werte für den Fall annehmen, dass ein 
Repräsentant einem Konzept eindeutig zugeordnet werden kann. Dies war 
die Motivation für eine detaillierte theoretische Betrachtung und Evaluation 
der Abhängigkeit des Detektionsmaßes von der Größe der Konzeptmenge in 
[Kuw16], deren Ergebnisse nachfolgend dargestellt werden. 


Betrachtung des Falls einer eindeutigen Zuordnung 


Dass das Detektionsmaß M(-) von der Größe |C| der Konzeptmenge ab- 
hängt, wird deutlich, wenn man Gleichung (8.4) genauer betrachtet. Dazu 
wird der Zusammenhang 


log(€l) = 10g(2)+1og(1€)-1og(2) = tog(2) +108( Și) 65 


genutzt und in Gleichung (8.4) eingesetzt, was zu 


log(|C|) ae log(2) + log(0.5-|C|) _ 
H(p(clr)) H(p(elr)) 
führt. Um den Entropieterm weiter umstellen zu können, wird für eine Kon- 


zeptmenge der Größe |C| = 2 die Verteilung p,(c|r) = {pı, p2} für eine 
eindeutige Zuordnung angenommen, wobei pı hier den Modalwert der Ver- 


M(p(elr)) = 1 (8.6) 


teilung beschreibt. Diese Verteilung wird nun auf den Fall einer größeren 
Konzeptmenge mit |C| > 2 verallgemeinert, indem die Wahrscheinlichkeit 
von p, gleichmäßig auf alle anderen Konzepte verteilt wird. Dies führt zu 
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der Verteilung 


= P2 P P2 
p(clr) = Ipı. Jel- ev ’ za ’ (8.7) 


welche genau |C| — 1 Terme enthält, in welchen p, auftritt. Die Entropie 
dieser Verteilung ergibt sich als 


BE pfèr tel afe) 
—Pi -log(pı ) — p -log( p2) + p -log( (el = 1) 


H(pe(e|r)) + log((|e|-1)"2) . 


Unter Anwendung dieser Annahme kann Gleichung (8.6) dann als 


7 log(2) + log(0.5-|€]) 
M(py(elr)) = H(p.(elr)) Fa log (( jej _ 1)P2) 1 (8.8) 


formuliert werden. In dieser Form wird sichtbar, dass für kleine p,-Werte 


nahe 0, wie es für gut beschriebene Repräsentanten üblicherweise der Fall 
ist, der Zähler dieses Bruchs schneller wächst als der Nenner, wenn die Grö- 
ße |C| der Konzeptmenge zunimmt. Dies führt zu erhöhten Werten im zu- 
ordnungsbasierten Detektionsmaß M(-). Dieser Umstand wird ebenfalls in 
Abbildung 8.3 illustriert. Dabei sind die Werte von M(-) nach Gleichung (8.8) 
für unterschiedliche Werte von p, und eine von |C| = 2 bis zu |C| = 50 va- 
riierende Größe der Konzeptmenge dargestellt. Die linke Teilabbildung 8.3a 
stellt die Ergebnisse bis zu einer Größe der Konzeptmenge von |C| < 10 dar, 
die rechte Teilabbildung ab |C| > 10 mit geänderter Skalierung. Die Ver- 
läufe für unterschiedliche p)-Werte nach Gleichung (8.8) sind dabei farblich 
kodiert: die beigen Werte repräsentieren pı = 0.95 bzw. p, = 0.05, die vio- 
letten Werte p = 0.65 bzw. p, = 0.35. Die grünen Werte (nur in 8.3a) stehen 
zum Vergleich für einen Grenzfall mit p, = 0.3 bzw. py = 0.7, in welchem 
nur noch bedingt eine Zuordnung zu einem Konzept vorliegt. Ebenfalls zum 
Vergleich ist der Verlauf einer Zuordnungsverteilung gezeigt, 
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M(p) M(p) 

2.0 = 

15 u 

1.0 Iil 

sH !E a | 

M =R A A AOR i . =: : tC] 
2 4 6 8 10 10 20 30 40 50 

(a) |C| < 10 (b) |C] > 10 


Abbildung 8.3: Veranschaulichung der Abhangigkeit des zuordnungsbasierten Detektionsma- 
Bes M(-) von der Größe der Konzeptmenge | C|. Dargestellt sind die Werte des 
Detektionsmaßes nach Gleichung (8.8) für eine beispielhafte eindeutige Zu- 
ordnungsverteilung über unterschiedlich großen Konzeptmengen. Die farblich 
unterschiedenen Verläufe stellen dabei Werte von pı = 0.95 bzw. p2 = 0.05 
(beige), pı = 0.65 bzw. pz = 0.35 (violett) und pı = 0.3 bzw. pọ = 0.7 
(grün) in Gleichung (8.8) dar. Zum Vergleich ist die Zuordnungsverteilung ei- 
nes schlecht beschriebenen Repräsentanten in blau dargestellt. Die linke Teil- 
abbildung (a) zeigt die Werte bis zu einer Größe |C| < 10 der Konzeptmenge, 
die rechte Teilabbildung (b) für |C| > 10. 


welche den Fall eines schlecht beschriebenen Repräsentanten darstellt. Aus 
der Abbildung wird deutlich, dass die Trennung der beiden Fälle nur für 
kleine Größen des Hintergrundwissens problematischer ist. Je mehr Kon- 
zepte im Hintergrundwissen enthalten sind, desto mehr unterscheiden sich 
die Fälle unter Anwendung des zuordnungsbasierten Detektionsmaßes. So 
kann z.B. ein Schwellwert von 0.25 zur Detektion von schlecht beschriebe- 
nen Repräsentanten genutzt werden. 


Betrachtung des Falls von schlecht beschriebenen Repräsentanten 


Um die Abhängigkeit des Detektionsmaßes M(-) von der Größe der Kon- 
zeptmenge auch im Fall der Zuordnungsverteilung eines schlecht beschrie- 
benen Repräsentanten untersuchen zu können, wird ein einfaches Modell 
für diese Verteilung genutzt. Dabei wird zunächst eine Zuordnungsvertei- 
lung von p,(c|r) := { Ps, Pa, Ps} angenommen für eine Konzeptmenge der 
Größe |C| = 3. Die einzelnen Werte spielen dabei nur eine untergeordne- 
te Rolle, werden aber als ähnlich groß angenommen. Um die Auswirkung 
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unterschiedlicher Größen der Konzeptmenge modellieren zu können, wird 
diese Verteilung erweitert, indem die drei Werte k-fach kopiert werden und 
die Verteilung entsprechend normiert wird. Dies ergibt die Verteilung 


._.$Ps Pa Ps P3 P4 Ps P3 Pa Ps 
Ps,x(elr) —, Ea p? k’ k’ k’ k °K’ k’ a . (8.9) 
Diese Verteilung modelliert aufgrund ihrer kopierten Struktur eine Art ver- 
rauschte Gleichverteilung für hinreichend große k. Die Entropie dieser Ver- 


teilung ergibt sich als 


H paale) = -ps -Ioe( 22) = pat BE) = ps-10e( 2°) 


(8.10) 
= H(p,(clr)) + (p3 + pa + ps): log( k) (8.11) 
= H(ps(e|r)) + log(|Csx|) — log(1€sl) (8.12) 


unter Verwendung der Beziehung | Cs, | = k - |C,| zwischen der Größe der 
kopierten und der ursprünglichen Konzeptmenge. Vergleicht man nun den 
Wert von M(-) für die ursprüngliche Verteilung, log( |C;| ) — H(ps(c|r)), 
gegen den Wert für die kopierte Verteilung, 


log( |Csx| ) — H( Psx(clr)) (8.13) 
= log( |Cs,k|) — H(ps(elr)) — log( |Csx|) + log(|@s|) (8.14) 
= log(|€s|) — H(psx(elr)) , (8.15) 


so wird deutlich, dass der Wert von M(-) nicht von der Größe der Kon- 
zeptmenge abhängt - im Fall der Zuordnungsverteilung eines schlecht be- 
schriebenen Repräsentanten und unter Annahme der kopierten Struktur ei- 
ner solchen Verteilung. 


Diese Betrachtungen bestätigen die grundsätzliche Anwendbarkeit des 
zuordnungsbasierten Detektionsmaßes M(-) für schlecht beschriebene Re- 
präsentanten. Darüber hinaus ist für eine solche Detektion allerdings auch 
ein Maß vorteilhaft, welches eine geringere Abhängigkeit von der Größe 
der Konzeptmenge besitzt und den Abstand der Werte für gut gegenüber 
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schlecht beschriebenen Repräsentanten vergrößert. Ausgehend von den 
vorhergehenden Betrachtungen kann zu diesem Zweck ein Ansatz genutzt 
werden, welcher sich nicht wie M(-) auf die Entropie der betrachteten 
Verteilung im Nenner bezieht, sondern auf die Größe der Konzeptmenge 
bzw. die aus ihr resultierende maximale Entropie log (|C|). Mit diesem 
Ansatz kann ein alternatives zuordnungsbasiertes Detektionsmaß M)>(-) 
definiert werden, welches auf das Intervall [0,1] beschränkt ist und sich als 


H(p(elr)) 
log(|C|) 


ergibt. Die Eigenschaften dieses alternativen Maßes sind in Abbildung 8.4 


M;(p(elr)) := 1 - (8.16) 


illustriert. Es ist erkennbar, dass das Maß weniger von der Größe der Kon- 
zeptmenge |C| abhängig ist und allgemein eine bessere Unterscheidung der 
Fälle von gut gegenüber schlecht beschriebenen Repräsentanten erlaubt. 


Mp) M;(p) 
BEE u u mE 0.81L__---= 2707 

0.6 N 

= Fi E i 0.4 al 

0.2 tes fi i i | | 0.2 | | | 

PEERS Bc) |, MMMM |. 
2 4 6 8 10 10 20 30 40 50 

(a) |€| < 10 (b) |e| > 10 


Abbildung 8.4: Veranschaulichung der Abhängigkeit des alternativen zuordnungsbasierten 
Detektionsmaßes M>(-) von der Größe der Konzeptmenge |C|. Dargestellt sind 
die Werte des Detektionsmaßes nach Gleichung (8.16) für eine beispielhaf- 
te eindeutige Zuordnungsverteilung über unterschiedlich große Konzeptmen- 
gen. Die farblich unterschiedenen Verläufe stellen dabei Werte von pı = 0.9 
bzw. p2 = 0.1 (beige) und pı = 0.65 bzw. pz = 0.35 (violett)dar. Zum Ver- 
gleich ist die Zuordnungsverteilung eines schlecht beschriebenen Repräsen- 
tanten in blau dargestellt. Die linke Teilabbildung (a) zeigt Werte für |C| < 10, 
die rechte Teilabbildung (b) für |C| > 10. 
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8.2.4 Evaluation 


Zur Demonstration der beschriebenen globalen und lokalen Detektionsma- 
ße wurde das bereits bekannte einfache Demonstrationsszenario verwendet, 
welches in Abschnitt 6.3.2 definiert wurde. Abbildung 8.5 stellt die Ergebnis- 
se für unterschiedliche Detektionsmaße über den Verlauf des Szenarios von 
sieben Zeitschritten dar. 


— Relative Entropiedifferenz M(-) 

_ |— Absolutes Schrittmaß g“() Erdbeerel 

30; |— Relatives Schrittmaß g’(-) a 
-- Modellgüte Q(R,C ) 

--- Modellkorrespondenz L(R|C ) 


Abbildung 8.5: Demonstration von verschiedenen Detektionsmaßen für schlecht beschrie- 
bene Repräsentanten im einfachen Demonstrationsszenario (vgl. Abschnitt 
7.6.3). Dargestellt sind die Werte des lokalen Detektionmaßes M(-) und der 
beiden globalen Maße g7(-) und g”(-) über die sieben Zeitschritte des Szena- 
rios. In den Zeitschritten 5-6 (roter Kasten) liegen dabei schlecht beschriebene 
Repräsentanten vor, welche von allen drei Maßen detektiert werden. Für die 
beiden globalen Maße, welche die absolute oder relative Änderung der Modell- 
korrespondenz durch den im Zeitschritt beobachteten Repräsentanten darstel- 
len, werden schlecht beschriebene Repräsentanten durch ein sprunghaftes An- 
steigen dargestellt. Für die relative Entropiedifferenz M(-) ist dies für Werte 
nahe 0 der Fall. 


Der zeitliche Ablauf ist identisch zu dem in Abschnitt 7.6.3 beschriebenen 
Ablauf zur Evaluation der quantitativen Modellbewertung. Als Referenz sind 
in Abbildung 8.5 daher auch die Gütemaße der Modellbewertung nochmals 
in grau dargestellt. Als Demonstrationsergebnisse sind die Werte der relati- 
ven Entropiedifferenz M(-) nach Gleichung (8.4) als lokales Detektionsmaß 
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sowie von zwei globalen Schrittmaßen, der absoluten Änderung der Mo- 
dellkorrespondenz g%(-) nach Gleichung (8.2) und der relativen Änderung 
g"(-) nach Gleichung (8.3), dargestellt. Schlecht beschriebene Repräsentan- 
ten treten dabei nur in den Schritten t = 5 und t = 6 auf, welche in der 
Abbildung durch einen roten Kasten hervorgehoben sind. Für alle drei dar- 
gestellten Detektionsmaße sind in diesen Zeitschritten deutlich veränderte 
Werte gegenüber den restlichen Zeitschritten festzustellen. Jeder der Zeit- 
schritte von t = 2 bis t = 6 repräsentiert dabei die Aufnahme eines neuen 
Repräsentanten ins Weltmodell, wie durch die entsprechenden Namen der 
Repräsentanten in der Abbildung angedeutet. Die globalen Schrittmaße zei- 
gen für die Zeitschritte t = 5 und t = 6 dabei deutlich höhere Werte als z.B. 
in den Schritten zuvor, und die relative Entropiedifferenz zeigt Werte na- 
he 0 für die schlecht beschriebenen Repräsentanten. Beides entspricht dem 
erwarteten Verhalten und demonstriert die grundsätzliche Anwendbarkeit 
der Maße. 


8.3 Adaptive Verwaltung von 
Hintergrundwissen 


Die Anpassung eines Hintergrundwissensmodells durch die adaptive Um- 
weltmodellierung soll nach bestimmten Prinzipien erfolgen. Dazu zählt 
die Bedarfsgerechtigkeit einer Anpassung, die Relevanz der eingebrachten 
Änderungen sowie ein Ausgleich zwischen Komplexität und Beschreibungs- 
fähigkeit des verwendeten Modells. Dieser Ausgleich sowie die Bedarfsge- 
rechtigkeit einer Anpassung kann durch die Gütemaße der quantitativen 
Modellbewertung adressiert werden. Durch Modellanpassungen werden 
neue oder aktualisierte Konzepte für die Typen von nur schlecht durch das 
Hintergrundwissensmodell beschriebenen Entitäten dem Hintergrundwis- 
sen hinzugefügt. Die Relevanz einer solchen Anpassung spiegeln sich somit 
in der Häufigkeit wider, mit welcher schlecht beschriebene Entitäten eines 
bestimmten Typs während des Betriebs eines Umweltmodells in der Umge- 
bung beobachtet werden. Das Auftreten solcher Entitäten kann dabei durch 
die zuvor beschriebenen Detektionsmaße festgestellt werden. Um über die 


326 


8.3 Adaptive Verwaltung von Hintergrundwissen 


Häufigkeit des Auftretens auf die Relevanz von Entitäten bzw. Typen von 
Entitäten schließen zu können, muss zusätzlich über dieses Auftreten Buch 
geführt werden. Dies ist eine der Aufgaben der adaptiven Wissensverwal- 
tung. Zu diesem Zweck wird dort eine Liste Sx der bisher detektierten 
schlecht beschriebenen Repräsentanten zusammen mit dem Zeitpunkt ihres 
Auftretens geführt. Wird zu einem Zeitpunkt ein oder mehrere aktuali- 
sierte Repräsentanten durch ein Detektionsmaß als schlecht beschrieben 
identifiziert, so werden diese Repräsentanten in die Liste aufgenommen. 


Weiterhin wird die Gesamtgüte des Modells durch die Maße der quantita- 
tiven Modellbewertung bestimmt. Ist diese Güte nicht mehr ausreichend, 
so wird ein Anpassungsvorgang angestoßen, welchem die geführte Liste 
der Repräsentanten als Ausgangsbasis dient. Bei diesem Anpassungsvor- 
gang wird auch beachtet, inwiefern die Aufnahme neuer oder aktualisierter 
Konzepte in das Hintergrundwissen zu einer Verbesserung der Modellgüte 
führt. Somit wird auch hier die Relevanz von Modellanpassungen beachtet 
und bewertet. Für die adaptive Modellverwaltung wird dabei in jedem Zeit- 
schritt eine Regelschleife ausgeführt, welche nachfolgend vorgestellt wird. 
Anschließend werden die einzelnen Teilaufgaben innerhalb dieser Regel- 
schleife genauer beschrieben. Die Darstellungen basierend auf [Kuw14]. 


8.3.1 Regelschleife der adaptiven Modellverwaltung 


Algorithmus 1 beschreibt das grundlegende Vorgehen der adaptiven Modell- 
verwaltung als eine Regelschleife. Durch diesen Algorithmus erfolgt somit 
die Umsetzung der adaptiven Umweltmodellierung und ihrer Prinzipien un- 
ter Verwendung der zuvor beschriebenen Methoden und Bewertungsmaßse. 
Der Algorithmus wird prinzipiell in jedem Zeitschritt ausgeführt. Aus Effi- 
zienzgründen kann allerdings auch eine Ausführung mit verringerter Fre- 
quenz im Umweltmodell vorgesehen werden. Die äußere Schleife des Al- 
gorithmus ist daher auch als symbolisch zu sehen, da der Algorithmus pro 
Zeitschritt mit den anderen Verarbeitungsschritten der Informationsverwal- 
tung im Umweltmodell koordiniert werden muss. In der Beschreibung des 
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Algorithmus werden schlecht beschriebene Repräsentanten als SBR abge- 
kürzt. Die einzelnen Teilschritte des Algorithmus und somit auch die Um- 
setzung der adaptiven Umweltmodellierung werden nachfolgend detailliert 
erläutert. 


Algorithmus 1 Adaptive Modellverwaltung 


1: # Eingabe: Weltmodell R, Hintergrundwissen C 

2: Sp t= {hs 

3: while System läuft im Zeitschritt t, do 

4 Sg i= {h 

5: Sg = Detektiere SBR (R, C; Sr); 

6 while Prüfe Modellgüte (R, C) do # nodellanpassung anstoßen 
7: = Bewerte SBR und wähle (Sz \ S% x). 

8: = = Finde Lernbeispiele (s*, Sg); 

9: c* = Berechne nn K a 

10: # Ern Prüfung Modellqualität: issung? 

11: if ie ee über Betriebszeit on ns Com nul = then 
12: C = Integriere Konzept (c*, C); # Aktu: Model 
13: Sz = Aktualisiere SBR-Liste (Sz, c*); 

14: else 

15: A = 5% U Sh; # Markiere als abgearbeitet 

16: end if 

17: # Führe weitere Anpassungen durch falls notwendig 

18: end while 


19: end while 


Detektiere SBR In diesem ersten Schritt werden unter Verwendung eines 
der vorgeschlagenen Detektionsmaße die im Zeitschritt t,, aktualisierten Re- 
präsentanten darauf geprüft, ob sie durch das aktuelle Hintergrundwissens- 
modell nur schlecht beschrieben werden können. Ist dies der Fall, werden die 
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entsprechenden Repräsentanten zur Liste der schlecht beschriebenen Reprä- 
sentanten Sg für den aktuellen Zeitpunkt hinzugefügt. 


Prüfe Modellgüte Hier wird die Veränderung der Güte des Modells im 
aktuellen Zeitpunkt t, gegenüber der Güte Q,, des letzten Zeitpunkts t; einer 
Modellanpassung bewertet. Unter Verwendung der Maße der quantitativen 
Modellbewertung kann dies z.B. als 

ARE) — Qy 2 Pg, O<I<n, (8.17) 
erfolgen, wobei hier explizit der Zustand des Weltmodells R,;, zum Zeit- 
punkt t,, referenziert wird. Über einen Schwellwert ®o wird dabei bewertet, 
wann die Güte eines Modells zu sehr abgefallen ist, im Sinne eines Anstei- 
gens des Bewertungsmaßes Q(-), und ob eine Modellanpassung notwendig 
ist. 


Bewerte SBR und wähle Im Fall einer durchzuführenden Modellanpassung 
wird zunächst für jeden schlecht beschriebenen Repräsentanten in der Liste 
Spr dessen Relevanz bzw. dessen geschätzte Nützlichkeit für ein angepasstes 
Modell bewertet. Als Ergebnis wird dann der relevanteste bzw. nützlichste 
Repräsentant s* als Kandidat für eine Modellanpassung ausgewählt. Dabei 
werden in der Liste Sz nur Repräsentanten beachtet, welche im aktuellen 
Zeitschritt noch nicht betrachtet wurden. Bereits betrachtete Repräsentan- 
ten werden in der Liste $% gespeichert. Die Details zum Vorgehen für die 
Auswahl von s* werden in Abschnitt 8.3.2 vorgestellt. 


Finde Lernbeispiele Das Ziel in diesem Schritt ist es, für den ausgewähl- 
ten Kandidaten-Repräsentanten s* alle diejenigen schlecht beschriebenen 
Repräsentanten auszuwählen, welche zum gleichen Typ von Entität wie s* 
gehören. Als Ergebnis dieses Schritts wird dann eine Menge S} von Lern- 
beispielen zuriickgegeben. Dieser Schritt wird ebenfalls in Abschnitt 8.3.2 
genauer beschrieben. 


Berechne Modellanpassungen Auf Basis der ausgewählten Lernbeispiele 
Sz und des bisherigen Hintergrundwissens kann in diesem Schritt ein ak- 
tualisiertes Konzept c* gelernt werden. Dabei muss auch entschieden wer- 
den, ob ein existierendes Konzept aktualisiert werden soll oder ob ein neues 
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Konzept gelernt werden muss. Fiir ein neues Konzept muss weiterhin auch 
die Stelle identifiziert werden, an welcher dieses anschließend in das Hin- 
tergrundwissensmodell eingeordnet werden kann. Auf das Thema des Kon- 
zeptlernens an sich geht Abschnitt 8.4 genauer ein. Vorgelagerte Aspekte 
werden in Abschnitt 8.3.3 beschrieben. 


Prüfe Modellgüte über bisherige Betriebszeit Bevor ein aktualisier- 
tes Konzepts c* in das Hintergrundwissensmodell integriert wird, muss 
zunächst die Relevanz dieser Anpassung für das objektorientierte Um- 
weltmodell bewertet werden. Dabei wird nicht nur der aktuelle Zeitschritt 
betrachtet, sondern die gesamte gespeicherte Historie des Umweltmodells. 
Die Frage, die durch diese Betrachtung beantwortet werden soll, ist, wie 
nützlich das aktualisierte Konzept über die bisherige Betriebszeit des Um- 
weltmodells zur Beschreibung der beobachteten Repräsentanten gewesen 
wäre. Genauer gesagt wird dabei die Verbesserung der Modellgüte betrach- 
tet, welche durch Aufnahme des Konzepts in das Hintergrundwissensmodell 
in Bezug auf den bisherigen Betrieb hätte erreicht werden können. Diese 
Verbesserung wird als die Relevanz des aktualisierten Konzepts für das 
Umweltmodell interpretiert. Zur Bewertung dieser Verbesserung wird die 
akkumulierte historische Modellgüte unter Verwendung des aktuellen Hin- 
tergrundwissens mit der akkumulierten hypothetischen Modellgüte unter 
der zusätzlichen Verwendung des aktualisierten Konzepts verglichen als 


> (Ra euer) < > Q (Ri e). (8.18) 


9 eS 
hypothetische Güte bisherige Giite 


Kann dabei eine Verbesserung erreicht werden, ist also der Wert der Gü- 
tebewertung fiir die hypothetische Giite kleiner als der Wert des aktuellen 
Modells, so wird das aktualisierte Konzept im nachsten Schritt in das Hin- 
tergrundwissensmodell aufgenommen. 


Integriere Konzept In diesem Schritt wird das aktualisierte Konzept c* in 
das Hintergrundwissensmodell an der identifizierten Stelle aufgenommen 
und somit die tatsächliche Modellanpassung durchgeführt. 
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Aktualisierung der Verwaltungslisten Nach einer erfolgreichen Mo- 
dellanpassung muss die Liste der schlecht beschriebenen Repräsentanten 
Sx aktualisiert werden. Dabei müssen all diejenigen Repräsentanten ent- 
fernt werden, welche nun durch das angepasste Hintergrundwissen gut be- 
schrieben werden können. Falls das aktualisierte Konzept nicht ins Hinter- 
grundwissen aufgenommen wird, so muss zumindest die Liste 87, der in die- 
sem Schritt betrachteten schlecht beschriebenen Repräsentanten aktualisiert 
werden. Hierbei werden alle als Lernbeispiele ausgewählten Repräsentanten 
als abgearbeitet markiert, da all diese denselben Typ von Entität repräsentie- 
ren und bei einer erneuten Ausführung der inneren Schleife nicht nochmals 
betrachtet werden sollen. 


Weitere Iterationen und Abbruch Nach dem ersten Durchlauf durch die 
innere Schleife des Modellverwaltungsalgorithmus wird erneut die Modell- 
güte geprüft. Fand eine Anpassung statt und ist die Güte nun gut genug (in 
Vergleich zu Qt)» analog zum Schritt „Prüfe Modellgiite*), so wird die Schleife 
abgebrochen. Gleichzeitig werden der aktuelle Zeitpunkt t, und Gütewert 
Q;, als neue Basiswerte für zukünftige Vergleiche gespeichert. 


Hat sich die Modellgüte dagegen noch nicht ausreichend verbessert, entwe- 
der, weil die Anpassung nicht ausreichend war oder gar keine Anpassung 
vorgenommen wurde, so wird die innere Schleife erneut durchlaufen, auf Ba- 
sis der in diesem Zeitschritt noch nicht betrachteten schlecht beschriebenen 
Repräsentanten Sz \ S}. Wurden in einem Zeitschritt bereits alle schlecht 
beschriebenen Repräsentanten betrachtet, so wird die innere Schleife eben- 
falls abgebrochen (dies ist im Algorithmus nicht explizit dargestellt). 


8.3.2 Auswahl relevanter Lernkandidaten 


Zuvor wurde das grundlegende Vorgehen der adaptiven Modellverwaltung 
in Form der in Algorithmus 1 beschriebenen Regelschleife dargestellt. In 
diesem und in den nachfolgenden Abschnitten werden nun einige der Teil- 
schritte dieser Regelschleife vertiefend dargestellt. 
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In der adaptiven Modellverwaltung muss, sobald der Bedarf fiir eine Modell- 
anpassung festgestellt wurde, eine geeignete Menge von Lernbeispielen als 
Datengrundlage einer solchen Anpassung ausgewählt werden. Dazu muss 
eine Gruppierung aller schlecht beschriebenen Repräsentanten in der Lis- 
te Sx stattfinden. Diese Gruppierung beschreibt dabei ein Problem der un- 
überwachten Clusteranalyse. In der adaptiven Umweltmodellierung sollen 
durch eine solche Gruppierung zwei Probleme gelöst werden. Zunächst soll 
die Relevanz der einzelnen, in der Liste enthaltenen Repräsentanten bewer- 
tet werden, da Relevanz eines der Leitprinzipien der adaptiven Umweltmo- 
dellierung ist. Weiterhin muss beachtet werden, dass durch die Konzepte 
des Hintergrundwissens nicht einzelne Entitäten, sondern Typen von Enti- 
täten modelliert werden. Somit müssen als Menge von Lernbeispielen für 
ein neues Konzept all diejenigen Repräsentanten ausgewählt werden, wel- 
che Instanzen desselben Typs darstellen. Dieses zweite Problem muss un- 
überwacht gelöst werden, da der Typ der Entitäten nicht bekannt ist. 


Relevanzbewertung für Repräsentanten 


Die adaptive Modellverwaltung geht zur Lösung dieser beiden Probleme in 
zwei Schritten vor. In Zeile 7 von Algorithmus 1 wird zunächst eine Rele- 
vanzbewertung aller noch nicht betrachteten Repräsentanten in Sg durch- 
geführt. Die Relevanz eines Repräsentanten wird in der adaptiven Umwelt- 
modellierung über die Häufigkeit seines Auftretens identifiziert. Allerdings 
soll auch hier nicht die Relevanz eines einzelnen Repräsentanten bewertet 
werden, sondern die des zugehörigen Entitätstyps. Somit muss zur Relevanz- 
bewertung eines Repräsentanten gezählt werden, wie oft eine Instanz des 
durch ihn (bzw. seine Entität) dargestellten Typs in der Liste Sg vorkommt. 
Zur Bewertung, ob ein Repräsentant eine Instanz desjenigen Typs darstellt, 
welche durch einen anderen Repräsentanten beschrieben wird, wird an die- 
ser Stelle als Maß eine Beschreibungslänge genutzt. Diese Beschreibungs- 
länge repräsentiert, wie viel Beschreibung für den Repräsentanten benötigt 
wird, wenn als Modell ein anderer Repräsentant genutzt wird. Ist diese Länge 
hinreichend klein, so kann dieser Repräsentant als eine Instanz des Typs des 
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anderen Repräsentanten betrachtet werden. Zu diesem Zweck kann als Be- 
wertungsmaß die Konzeptkorrespondenz L (- |) nach Gleichung (7.8) ein- 
gesetzt werden. Da Reprasentanten und Konzepte jeweils tiber Attributmen- 
gen beschrieben werden und somit syntaktisch gleichartig darstellbar sind, 
können formal auch Repräsentanten in der Rolle eines potentiellen Konzepts 
in das Bewertungsmaß L (- | - ) eingesetzt werden. Daher kann nun die Rele- 
vanz eines schlecht beschriebenen Repräsentanten s bzw. die Relevanz des 
durch ihn dargestellten Entitätstyps als die Größe 


r(s) := |{ses, | L@]s) < oF}| (8.19) 


der Menge der zum Repräsentanten im Sinne einer Beschreibungslänge hin- 
reichend ähnlichen weiteren Repräsentanten aus Sz berechnet werden. Der 
Schwellwert ®L beschreibt hier die maximal erlaubte Beschreibungslänge. 
Als Stellvertreter für den als am relevantesten bewerteten Typ von Entität 
wird dann derjenige Repräsentant aus Sz ausgewählt, welcher Gleichung 
(8.19) maximiert, also die größte Anzahl an geschätzten Instanzen besitzt. 
Dieser Repräsentant dient dann als Kandidat s* für eine Modellanpassung. 


Geschätzte Nützlichkeit von Repräsentanten 


Als Alternative zu einer über die Typ-Auftrittshäufigkeit bewerteten Re- 
levanz kann auch die geschätzte Nützlichkeit eines Repräsentanten für 
eine Modellanpassung als Auswahlkriterium genutzt werden. Die geschätz- 
te Nützlichkeit bewertet dabei, wie viel weniger Beschreibung benötigt 
wird, wenn als zusätzliches Konzept der betrachtete Repräsentant ins 
Hintergrundwissensmodell aufgenommen wird. Auch hier wird für eine 
Umsetzung dieses Ansatzes wieder die syntaktische Ähnlichkeit von Re- 
präsentanten und Konzepten ausgenutzt und der betrachtete Repräsentant 
s hypothetisch der Konzeptmenge € hinzugefügt. Für diese erweiter- 
te Konzeptmenge wird dann berechnet, um wie viel die Beschreibung des 
Weltmodells nun kürzer ist gegenüber der Beschreibung unter der ursprüng- 
lichen Konzeptmenge ohne diesen Repräsentanten. Eine solche Nützlichkeit 
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kann unter Verwendung der Modellkorrespondenz als die Differenz 
AL(s) := L(Ri, |C) - L(R, | Cu {s}) (8.20) 


beschrieben werden. Für diesen Ansatz wird dann der Repräsentant mit der 
höchsten Nützlichkeit als Kandidat s* für Modellanpassungen ausgewählt. 


Finden von Lernbeispielen 


Um den zweiten Teil des Gruppierungsproblems zu lösen, müssen nun als 
Lernbeispiele (Zeile 8 in Algorithmus 1) alle Repräsentanten gefunden wer- 
den, welche zum ausgewählten Kandidat s* hinreichend ähnlich sind. Zur 
Bewertung der Ähnlichkeit zwischen Repräsentanten und Konzepten wird 
in der objektorientierten Umweltmodellierung die Repräsentant-zu-Konzept 
Zuordnung genutzt. Auch in diese kann anstelle eines Konzepts ein Reprä- 
sentant eingesetzt werden, aufgrund der syntaktisch gleichartigen Darstel- 
lung von Repräsentanten und Konzepten. Somit kann die Menge der Lern- 
beispiele für eine Modellanpassung auf Basis des Kandidaten s* als 


Sh := {s E Sr | p(s*|s) > BF} (8.21) 


berechnet werden, wobei D$ hier einen Schwellwert für die Ähnlichkeitsbe- 
wertung darstellt. Dieser Schwellwert kann dabei analog zum Vorgehen der 
erweiterten Repräsentant-zu-Konzept Zuordnung (vgl. Abschnitt 6.4) als ein 
Vielfaches eines Basiswerts festgelegt werden. 


8.3.3 Durchführung von Modellanpassungen 


Für eine Modellanpassung muss aufgrund der Lernbeispiele ein aktualisier- 
tes Konzept gelernt werden. Bevor ein solches Konzept gelernt werden kann, 
muss zunächst entschieden werden, ob ein existierendes Konzept durch den 
Lernvorgang angepasst oder ein gänzlich neues Konzept gelernt werden soll. 
Als ein Ansatzpunkt für eine solche Entscheidung können die definierten 
Detektionsmaße für schlecht beschriebene Repräsentanten genutzt werden, 
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z.B. die zuordnungsbasierten lokalen Detektionsmaße M(-) bzw. M,(-). Um 
zu entscheiden, ob ein Konzept im Hintergrundwissen existiert, das ähnlich 
genug zu den Lernbeispielen ist, kann z.B. die mittlere relative Entropiedif- 
ferenz für relevante Konzepte berechnet werden. Liegt der beste (niedrigste) 
dieser Werte innerhalb eines festgelegten Intervalls, so kann das entspre- 
chende Konzept für eine Erweiterung in Betracht gezogen werden. Dieser 
Aspekt wurde in dieser Arbeit allerdings nicht tiefergehend betrachtet. Eine 
detaillierte Untersuchung der Problemstellung verbleibt daher eine zukünf- 
tige Arbeit. 


Nachdem eine Modellanpassung durchgeführt wurde, muss das aktualisierte 
Konzept in das Hintergrundwissensmodell integriert werden. Wurde dabei 
ein existierendes Konzept aktualisiert, so ist dessen Einordnung ins Hinter- 
grundwissensmodell bereits gegeben. Wurde dahingegen ein gänzlich neues 
Konzept gelernt, so kann dieses zwar in die Konzeptmenge € (als ein flaches 
Wissensmodell) aufgenommen werden, muss aber schließlich noch in der 
Taxonomie des hierarchischen Wissensmodells verortet werden. Auch für 
diese Aufgabe können die definierten Ähnlichkeitsmaße genutzt werden, um 
im bisherigen Hintergrundwissensmodell Hinweise auf mögliche Einhäng- 
punkte für das neu gelernte Konzept zu finden. Für eine tatsächliche Veror- 
tung im Hintergrundwissensmodell müssen allerdings auch weitere Aspekte 
beachtet werden, die sich aus den Entwurfsprinzipien des Hintergrundwis- 
sensmodells ergeben, wie z.B. Grundsätze der formalen Ontologie. Daher 
ist in dieser Arbeit keine automatisierte Verortung neu gelernter Konzepte 
in einem hierarchischen Wissensmodell vorgesehen, sondern eine manuelle 
Verortung unter menschlichem Eingreifen. 


Für ein neu gelerntes Konzept müssen auch weitere Aspekte beachtet wer- 
den. Dazu zählt beispielsweise, dass das Konzept durch einen sprechenden 
Namen beschrieben werden muss. Darüber hinaus müssen die nicht beob- 
achtbaren semantischen Aspekte des Konzepts ergänzt werden, in Form von 
semantischen Attributen und Relationen. Ein erster Ansatz, wie dies unter 
Verwendung von existierenden, externen Wissensbasen umgesetzt werden 
kann, wird in [Kuw15] beschrieben. Dabei werden verschiedene Aufgaben 
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betrachtet. Als eine erste Aufgabe wird das erwähnte Ableiten eines spre- 
chenden Namens für ein Konzept betrachtet. Auf dem Ergebnis dieser Auf- 
gabe aufbauend wird als zweite Aufgabe das Extrahieren von zusätzlichen 
Attributen aus existierenden Wissensmodellen unter Verwendung des Kon- 
zeptnamens betrachtet. 


Als Lösungsansatz für die erste Aufgabe wurden in [Kuw15] unterschied- 
liche, über das World Wide Web ansprechbare Dienste betrachtet, welche 
für einen gegebenen Bildausschnitt entsprechende Klassennamen als Ergeb- 
nis liefern. Die für diesen Lösungsansatz benötigten Bildausschnitte müss- 
ten in der objektorientierten Umweltmodellierung dabei direkt von der Sen- 
sorik eines kognitiven Systems bezogen werden. Durch eine erste Umset- 
zung dieses Ansatzes und unter Verwendung von beispielhaften Bildaus- 
schnitten konnte evaluiert werden, dass ein solcher Lösungsansatz zumin- 
dest für einige der betrachteten Objekte die gewünschten Klassennamen lie- 
fern kann’. Zugleich hat sich bei diesem Ansatz als problematisch erwiesen, 
dass einerseits die mitgelieferten Konfidenzwerte für einen Klassennamen 
sich über unterschiedliche Dienste teilweise deutlich unterscheiden, und an- 
dererseits ein Ansatz oftmals unterschiedliche Klassennamen mit gleicher 
Konfidenz zurückliefert. Diese unterschiedlichen Klassennamen beschrei- 
ben dabei häufig Klassen, die in einer semantischen Generalisierungsbezie- 
hung („is-a*-Relation) stehen. Durch einen ebenfalls in [Kuw15] betrachte- 
ten einfachen Fusionsansatz über die Ergebnisse unterschiedlicher Dienste 
konnten für beide Probleme erste Verbesserungen erzielt werden. 


Als Lösungsansatz für die zweite Aufgabe wurde die Extraktion von Attri- 
butwerten aus der Cyc? Top-Level Ontologie und Datenbank (vgl. Abschnitt 
2.3.2) betrachtet. Ein erstes Problem war hierbei, auf Basis eines gegebenen 
Namens das richtige Konzept in der Datenbank auszuwählen, d.h. also ei- 
ne semantische Disambiguierung des Namens durchzuführen. Als ein erster 


* Da diese Auswertung schon einige Zeit zurückliegt, sollte sich im Verlauf der Zeit analog 
zur Entwicklung des allgemeinen Standes der Technik im Bereich der Objektklassifikation 
auch für solche web-basierten Dienste die Erkennungsleistung nochmals deutlich verbessert 
haben. 

2? Dabei wurde die „ResearchCyc“ Variante genutzt. 
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Ansatz wurde in [Kuw15] eine einfache Heuristik umgesetzt, die dasjenige 
Konzept auswählt, für welches in seinen untergeordneten Konzepten der ge- 
suchte Name am häufigsten auftritt. Diese Heuristik war für eine einfache 
Demonstration ausreichend, wurde darüber hinaus aber nicht tiefergehend 
evaluiert. Unter Anwendung dieser Heuristik war es möglich, zumindest für 
einige der betrachteten Konzepte einige wenige relevante Attributwerte zu 
extrahieren. Allerdings stellten die extrahierten Attributwerte für die be- 
trachteten Konzepte häufig eher unspezifische Intervalle von Werten dar. 


Das Problem der Ergänzung von neu gelernten Konzepten durch semanti- 
sche Attribute bedarf daher noch einer vertieften Betrachtung. Zu diesem 
Zweck können auch Verfahren des Ontologie-Lernens hilfreich sein, welche 
in dieser Arbeit allerdings nicht weiter betrachtet wurden. 


8.4 Lernen probabilistischer Konzepte 


In der adaptiven Umweltmodellierung besteht die Aufgabe des Konzeptler- 
nens daraus, aus einer gegebenen Menge von Lernbeispielen eine neue Kon- 
zeptdefinition abzuleiten. Die Ausgangssituation ist dabei ähnlich wie die 
des klassischen Konzeptlernens oder der konzeptuellen Clusteranalyse (vgl. 
Abschnitt 2.4.1). Dabei soll jeweils auf Grundlage einer relativ geringen Men- 
ge von Beispielen durch induktive Inferenz die Beschreibung eines genera- 
lisierten Konzepts abgeleitet werden. Induktive Inferenz stellt dabei im Ge- 
gensatz zur Deduktion einen erweiternden Schluss dar. Wie diese Erwei- 
terung bzw. Generalisierung aussieht, hängt i. A. vom induktiven Bias eines 
Lernverfahrens ab, wie z. B. von der Struktur des Raums der möglichen Kon- 
zepte. Im Gegensatz zum klassischen Konzeptlernen und der konzeptuellen 
Clusteranalyse werden in der adaptiven Umweltmodellierung die Werte der 
Attribute von sowohl Lernbeispielen als auch von zu lernenden Konzepten 
probabilistisch durch Wahrscheinlichkeitsverteilungen beschrieben. Der zu- 
grunde liegende Raum der möglichen Konzepte wird weiterhin durch die 
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Definitionen des Metamodells bestimmt. Dort werden strukturelle Annah- 
men fiir Konzepte getroffen. Ihre Attribute werden dabei durch ein Skalen- 
niveau und einen Wertebereich beschrieben. Weitere Restriktionen für At- 
tribute werden nicht definiert. Eine Generalisierung von Konzepten kann 
nun innerhalb dieses grundsätzlichen Konzeptraums erfolgen. Diese Gene- 
ralisierung beschränkt sich in der adaptiven Umweltmodellierung, ähnlich 
wie beim klassischen Konzeptlernen, auf die Generalisierung von Attribut- 
werten. Zusätzliche Attribute gegenüber den in der Menge der Lernbeispiele 
enthaltenen werden nicht definiert. Eine Generalisierung von Attributwer- 
ten kann in der adaptiven Umweltmodellierung somit, unter Beachtung des 
Skalenniveaus und Wertebereichs eines Attributs, flexibel erfolgen. 


8.4.1 Allgemeines Vorgehen 


Für das Konzeptlernen in der adaptiven Umweltmodellierung ist als Aus- 
gangssituation eine Menge von Repräsentanten als Lernbeispiele gegeben. 
Für diese Repräsentanten muss nun eine vereinheitlichte und generalisier- 
te Konzeptdefinition gefunden werden, welche alle Repräsentanten zu be- 
schreiben vermag. Dabei wird in der adaptiven Umweltmodellierung jedes 
Attribut individuell betrachtet. Insgesamt wird in zwei Schritten vorgegan- 
gen. Zunächst werden pro Attribut die Wahrscheinlichkeitsverteilungen der 
Lernbeispiele zu einer aggregierten Verteilung kombiniert. Dies wird in Ab- 
schnitt 8.4.2 beschrieben. Anschließend wird, ebenfalls individuell pro Attri- 
but, diese aggregierte Verteilung generalisiert. Dies wird in Abschnitt 8.4.3 
beschrieben. Die Darstellung dieser Aspekte basiert auf [Kuw14]. 


Als Ausgangssituation, vor allem in Bezug auf die individuelle Kombination 
von Attributen, können dabei zwei Fälle unterschieden werden. Einerseits 
kann es sein, dass ein gänzlich neues Konzept gelernt werden soll, rein auf 
Basis der gegebenen Repräsentanten als Lernbeispiele. In diesem Fall müs- 
sen pro Attribut nur die Verteilungen aller Lernbeispiele kombiniert werden. 
Andererseits kann es sein, dass ein existierendes Konzept erweitert werden 
soll. In diesem Fall ist neben den Lernbeispielen auch noch die Definition des 
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Konzepts selbst gegeben. Wie vorausgehend bereits erwähnt, sind die Be- 
schreibungen von Repräsentanten und Konzepten über ihre Attributmengen 
syntaktisch gleichartig. Daher ist es möglich, den Fall der Erweiterung eines 
existierenden Konzepts auf ähnliche Weise wie den Fall des Erlernens eines 
neuen Konzepts zu behandeln. Das entsprechende Vorgehen wird nachfol- 
gend vorgestellt. 


8.4.2 Lernen von Konzeptdefinitionen aus Beispielen 


Aufgrund der syntaktischen Gleichartigkeit von Repräsentanten und Kon- 
zepten kann zur Definition eines neuen Konzepts ein einfacher Ansatz ge- 
wählt werden. Dieser Ansatz besteht, grob gesagt, aus der Aggregation der 
unterschiedlichen Attributwerte der als Lernbeispiele gegebenen Repräsen- 
tanten S} durch Mittelung. Bei diesem Ansatz wird zunächst jedes (deskrip- 
tive) Attribut a*! des neu zu definierenden Konzepts individuell betrachtet. 
Für jedes Attribut müssen nun die Wahrscheinlichkeitsverteilungen pr, (a) 
der Attribute a”! der Lernbeispiele kombiniert werden. Für ein diskretes At- 
tribut a®*! kann dies in Form der normierten Summe 


Padi (a) 5 >) Pari (a) (8.22) 


Cyr,i 


erfolgen. Für ein stetiges Attribut a®*' muss eine derartige Kombination in 


Form einer Mischverteilung erfolgen, d.h. als 


1 
Paewi(a) = > Ts: ] * Pari (a) n (8.23) 
resi, “R 


Falls eine der stetigen Verteilungen der Lernbeispiele dabei bereits durch 
eine Mischverteilung beschrieben wird, müssen die Gewichte ihrer Kompo- 
nenten entsprecht aktualisiert werden mit dem zusätzlichen Gewichtungs- 
faktor 


[szl 
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Falls nicht ein ganzlich neues Konzept gelernt, sondern ein existierendes 
Konzept erweitert werden soll, wird der grundsätzlich gleiche Ansatz wie be- 
schrieben gewählt. Zusätzlich geht nun allerdings in die Summen (8.22) und 
(8.23) jeweils die Verteilung des Konzeptattributs gewichtet mit ein. Über die 
Gewichtung der Konzeptverteilung gegenüber der Gesamtheit der Vertei- 
lungen der Lernbeispiele kann dabei festgelegt werden, wie stark eine exis- 
tierende Konzeptdefinition auf die neuen Lernbeispiele angepasst werden 
soll. Eine natürliche Wahl für diese Gewichtung stellt die Anzahl der Lern- 
beispiele dar, die ursprünglich zur Definition des Konzepts genutzt wurden. 
Wird ein Konzept z.B. durch den beschriebenen Lernprozess neu definiert, 
kann zusätzlich zur Beschreibung des Konzepts auch die Anzahl der Lern- 
beispiele abgespeichert werden, welche zur Definition des Konzepts genutzt 
wurden. Soll ein solches Konzept dann später erweitert werden, kann diese 
Anzahl als Gewichtung gegenüber der Anzahl der zur Erweiterung gegebe- 
nen Lernbeispiele verwendet werden. 


8.4.3 Generalisierung von Konzept-Attributen 


Der erste Schritt beim Konzeptlernen in der adaptiven Umweltmodellierung 
besteht daraus, individuell pro Attribut die Wahrscheinlichkeitsverteilungen 
der Lernbeispiele zu kombinieren. Als zweiter Schritt soll die resultierende 
aggregierte Wahrscheinlichkeitsverteilung anschließend noch generalisiert 
werden. Der Begriff der Generalisierung kann dabei so verstanden werden, 
dass eine gegebene Attributverteilung durch eine entsprechende Generali- 
sierungsoperation in eine weniger spezifische Version der Verteilung über- 
führt werden soll. Weniger spezifisch bezieht sich in diesem Fall auf die 
von der Verteilung erlaubten Werte. Im Sinne der Modellbewertung wird 
durch eine Generalisierung die Komplexität eines Attributs reduziert. Die 
generellste, am wenigsten komplexe Form einer Attributverteilung ist dabei 
durch eine Gleichverteilung über dem entsprechenden Wertebereich gege- 
ben. Die Generalisierung einer Attributverteilung transformiert diese somit 
in eine ähnliche Verteilung in Richtung dieser Gleichverteilung. Auf wel- 
che Weise eine Generalisierung genau erfolgen kann, hängt dabei von der 
dem Wertebereich zugrunde liegenden inneren Struktur der Werte ab. Diese 
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Struktur wird größtenteils durch das Skalenniveau eines Attributs charakte- 
risiert. Für die Generalisierung von Attributverteilungen müssen somit dis- 
krete von stetigen Attributen unterschieden werden. Für diskrete Attribute 
müssen weiterhin nominale von ordinal skalierten Attributen unterschie- 
den werden. 


In der adaptiven Umweltmodellierung wird eine Generalisierung als zielfüh- 
rend betrachtet, wenn sie eine gegebene Attributverteilung konsistent auf 
mehr erlaubte Werte erweitert. Dabei liegt die Annahme zugrunde, dass ei- 
ne Erweiterung der zulässigen Attributwerte einer Verteilung zunächst die- 
jenigen Attributwerte betrachten sollte, welche ähnlich zu den bisher er- 
laubten Attributwerten sind. Diese Annahme ist, aus didaktischen Gründen, 
für deterministische Werte formuliert. Sie lässt sich auf probabilistisch be- 
schriebene Werte übertragen, indem die Zulässigkeit von Werten als eine 
signifikante Wahrscheinlichkeit über diesen Werten interpretiert wird. Eine 
Grundannahme zur Generalisierung von Attributverteilungen in der adap- 
tiven Umweltmodellierung ist es somit, dass die einzelnen Werte eines At- 
tributs hinsichtlich ihrer Ähnlichkeit zumindest qualitativ bewertet werden 
können sollten. Dies ist für ordinal und kardinal skalierte Attribute der Fall, 
für nominale Attribute dagegen nicht. Im klassischen Konzeptlernen nach 
Mitchell [Mit79] werden nominale Attribute generalisiert, indem das Vorlie- 
gen von mindestens zwei unterschiedlichen Werte in den Lernbeispielen als 
Indikator dafür gedeutet wird, dass jeder Wert des Wertebereichs für dieses 
Attribut zulässig ist. Diese Annahme wird für die adaptive Umweltmodellie- 
rung allerdings als zu stark empfunden. Eine Generalisierung von diskreten 
Attributen wird daher nur für ordinal skalierte Attribute betrachtet. Für die- 
se wird ihre zugrunde liegende Ordnungsrelation als eine qualitative Ähn- 
lichkeitsbewertung angesehen. 
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Generalisierung von ordinalen Attributen 


Methodisch kann fiir eine Generalisierung der Wahrscheinlichkeitsvertei- 
lung von ordinalen Attributen Inspiration im Bereich der digitalen Bildverar- 
beitung gefunden werden. Im Speziellen stellen sog. morphologische Opera- 
tionen auf Grauwertbildern hierbei interessante Ansätze dar. Durch Opera- 
tionen wie eine Dilatation, Erosion und Schließung kann dabei z.B. erreicht 
werden, dass Lücken in Grauwertbildern durch eine konsistente Fortsetzung 
von räumlichen Intensitätsverläufen geschlossen werden. 


Ein solches Vorgehen kann nun auf die Generalisierung der kumulierten 
Wahrscheinlichkeitsverteilungen von ordinalen Konzept-Attributen über- 
tragen werden. Dabei ist es die Intension, die zulässigen Werte einer Ver- 
teilung graduell auch auf Teilbereiche auszudehnen, welche eine konsisten- 
te Erweiterung der bisher zulässigen Werte darstellen und somit eventu- 
elle, nicht durch die Beispiele abgedeckte Teilbereiche (Lücken) zu füllen. 
Bei einem solchen Vorgehen wird implizit angenommen, dass diese Lücken 
nur deswegen nicht bereits durch die Beispiele abgedeckt werden konnten, 
da als Lerndaten bisher nur eine geringe Menge von Beispielen zur Verfü- 
gung stand. Dieses Vorgehen wird in Abbildung 8.6 illustriert. Dargestellt 
sind Verteilungen für zwei beispielhafte Attribute (links) sowie deren kombi- 
nierte Verteilung (rechts oben). Die Verteilung des generalisierten Attributs 
(rechts unten) ergibt sich dabei durch Anwendung einer Schließungsope- 
ration. 


Umgesetzt werden kann dieses Vorgehen für die Generalisierung von ordi- 
nalen Attributen in der adaptiven Umweltmodellierung z.B. dadurch, dass 
ein diskreter normierter Faltungskern über den Wertebereich eines ordina- 
len Attributs geschoben wird. Dabei wird der Wert der Verteilung am Mit- 
telpunkt des Kerns jeweils durch das Ergebnis der Faltung von Verteilung 
und Kern ersetzt. Für das gewünschte Verhalten bietet sich z.B. ein diskre- 
tisiertes eindimensionales Gaußfilter als Faltungskern an. 
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Lt Attribut 1 1.0.7 Kombiniertes Attribut 
0.8 0.8 

0.6 0.6 

0.4 0.4 

0.2 0.2.5 

1.0 F Attribut 2 1.0 Generalisiertes Attribut 
0.8 0.8 

0.6 0.6 

0.4} 0.4 

0.2 F 0.2 


Abbildung 8.6: Beispiel für die Kombination (rechts oben) zweier diskreter Attribute (links) 
und die Generalisierung (rechts unten) der kombinierten Verteilung für den 
Fall, dass die Attribute ordinal skaliert sind. 


Generalisierung von stetigen Attributen durch 
Komponentenreduktion 


Stetige Attribute werden in der objektorientierten Umweltmodellierung 
durch Normalverteilungen oder durch Gaußmischverteilungen beschrie- 
ben. Durch die Kombination der Wahrscheinlichkeitsverteilungen aller 
Lernbeispiele für ein betrachtetes stetiges Attribut nach Gleichung (8.23) 
entsteht somit eine neue Gaußmischverteilung. Als Lernbeispiele werden 
im vorgestellten Ansatz diejenigen Repräsentanten ausgewählt, die sich 
möglichst ähnlich sind und für welche angenommen wird, dass sie den 
gleichen Typ von Entität darstellen. Aufgrund dieser Ähnlichkeit kann 
für die kombinierte Verteilung angenommen werden, dass im Regelfall 
viele ähnliche Normalverteilungen (ähnlich z.B. in Bezug auf ihre Position) 
als Komponenten in der Mischverteilung enthalten sind. Eine derartige 
Mischverteilung beschreibt die Werte eines Attributs bzgl. der dargestellten 
Informationen dann auf eine teilweise redundante Weise. Zugleich ist sie 
aufgrund ihrer Komponentenanzahl sehr komplex. Durch eine Reduktion 
der Anzahl der enthaltenen Komponenten kann eine solche Verteilung 
vereinfacht und in ihrer Redundanz reduziert werden, ohne signifikante 
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Verluste fiir die dargestellten Informationen befiirchten zu miissen. Zu- 
gleich kann dabei eine Generalisierung der Verteilung erreicht werden. 
Bei einer Reduktion der Komponenten einer Mischverteilung werden diese 
Komponenten sukzessive durch neue, kombinierte Komponenten ersetzt. 
Eine Generalisierung betrifft dabei den Aspekt, dass durch eine solche 
Kombination auch neue Komponenten entstehen können, welche mögliche 
Lücken in einer Verteilung schließen. In der adaptiven Umweltmodellierung 
können sich derartige Lücken z.B. aufgrund der Werte der Lernbeispiele 
ergeben. Eine Generalisierung mittels Komponentenreduktion setzt daher 
das für die Modellanpassung gewünschte Verhalten um, in welchem sich die 
Generalisierung an den existierenden Werten einer Verteilung orientiert. 
Diese sind hier in Form der einzelnen Komponenten gegeben. 


Für die adaptive Umweltmodellierung können zur Generalisierung von 
Konzept-Attributen somit Verfahren der Gaufimischreduktion’ eingesetzt 
werden. Derartige Verfahren ersetzen für eine Reduktion der Komponenten- 
anzahl sukzessive Komponenten durch eine neue, kombinierte Komponente. 
In der Literatur existieren verschiedene Ansätze für eine Gaußmischreduk- 
tion. Ein grundlegendes, agglomeratives Vorgehen wird von West [Wes93] 
beschrieben. Es besteht aus den in Algorithmus 2 dargestellten Schritten. 


Algorithmus 2 Agglomerative Komponentenreduktion für Gaußmisch- 
verteilungen 

I: # Eingab Gaußmischdicht nit m Kompon I 

: while Abbruchkriterium nicht erreicht do # z.B. Anzahl Komponenten 


2 
3: Finde beste zwei Kandidaten fiir eine Verschmelzung 
4 


Verschmelze und ersetze die Kandidaten durch neue Komponente 
5: end while 
6: # Ausgabe: Reduzierte Gaußmischdichte mit k < m Komp 


* Englisch: Gaussian mixture reduction 
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Verschiedene Ansätze zur Gaußmischreduktion unterscheiden sich nun dar- 
in, auf welche Weise die beiden Schritte und das Abbruchkriterium umge- 
setzt werden. Von Runnalls [Run07] und Salmond [Sal09] wird beispiels- 
weise eine Kombination von Komponenten pro Schritt (Zeile 4 in Algorith- 
mus 2) vorgeschlagen, durch welche der Erwartungswert und die Varianz 
der Gesamtverteilung erhalten bleiben. Für zwei Komponenten N (u , of) 
und N (nz, a?) mit den Gewichten w, und w, kann die kombinierte nor- 
malverteilte Komponente N (Me Ko), mit Gewicht w, dabei als 


Wy = W, + Wz 3 (8.24) 
= w = wz 
w i= —, u, i= —, 8.25 
1 7 2 TA (8.25) 
Me = Wh + Dp , (8.26) 
= a I 2 
of = bo + Do + DW (Mm — w) (8.27) 


berechnet werden. Für die Auswahl (Zeile 3 in Algorithmus 2) der pro Schritt 
zu kombinierenden Komponenten existieren verschiedene Ansätze. Globale 
Ansätze (z.B. [Run07, Hub08]) orientieren sich dabei z.B. daran, pro Schritt 
eine möglichst zur Ausgangsverteilung ähnliche reduzierte Mischverteilung 
zu erzeugen. Zur Bewertung der Ähnlichkeit der Verteilungen können der 
integrierte quadratische Abstand der Verteilungen [Hub08] bzw. ein Ansatz 
auf Basis der Kullback-Leibler Divergenz [Run07] verwendet werden. Loka- 
le Ansätze (z. B. [Wes93, Sal09]) versuchen dagegen, in jedem Schritt jeweils 
möglichst nahe zueinander gelegene Komponenten zu kombinieren. Dabei 
kann beispielsweise die Komponente mit dem aktuell kleinsten Gewicht mit 
ihrer nächst gelegenen Komponente (im Sinne einer euklidischen Distanz) 
kombiniert werden [Wes93]. Von Salmond [Sal09] wird weiterhin die ge- 
wichtete Mahalanobis Distanz 


2 
ww; (Mi — Hj) 
di ; a E 


= 8.28 
a w+W om ee 
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zweier Komponenten i und j genutzt, um in jedem Schritt die zwei paarwei- 
se nächst gelegenen Komponenten zu bestimmen. Dabei beschreibt oå, die 
Varianz der gesamten Mischverteilung. 


Als ein übliches Abbruchkriterium (Zeile 2 in Algorithmus 2) kann die ge- 
wünschte Anzahl von in der Verteilung verbleibenden Komponenten vorge- 
geben werden [Wes93, Run07]. Weiterhin kann auch eine maximal erlaub- 
te Abweichung der reduzierten Verteilung von der ursprünglichen Misch- 
verteilung als ein Abbruchkriterium genutzt werden [Hub08]. Ein solches 
Abbruchkriterium ist dabei für die Generalisierung der Verteilungen von 
Konzept-Attributen in der adaptiven Umweltmodellierung besonders inter- 
essant, da eine gewünschte Anzahl von Komponenten für Attributverteilun- 
gen hier teilweise nur schwer vorhergesagt werden kann. 


Zur Bewertung der Ähnlichkeit einer reduzierten Verteilung gegenüber 
der ursprünglichen kombinierten Mischverteilung eines Konzept-Attributs 
stellt weiterhin die Kullback-Leibler Divergenz ein geeignetes Maß dar 
(vgl. [Hub08]). Die Berechnung der Kullback-Leibler Divergenz muss dabei 
allerdings numerisch erfolgen, da für Gaußmischverteilungen keine ge- 
schlossene Lösung angegeben werden kann [Hub08]. Für die Auswahl der 
pro Schritt zu kombinierenden Komponenten bietet sich für die adaptive 
Umweltmodellierung ein lokaler Ansatz an. Durch einen lokalen Ansatz 
kann der beschriebene Generalisierungseffekt besser erreicht werden, in- 
dem sichergestellt wird, dass immer zuerst nahe gelegene, benachbarte 
Komponenten kombiniert werden. Zu diesem Zweck kann die gewichtete 
Mahalanobis Distanz (8.28) eingesetzt werden. Die Mahalanobis Distanz bie- 
tet weiterhin den Vorteil, dass sie ein skalierungsinvariantes Maß darstellt 
[Sal09]. Dies ist z. B. vorteilhaft, wenn stetige Attribute in unterschiedlichen 
Maßeinheiten gegeben sind. Für die Kombination zweier derart ausgewähl- 
ter Komponenten wird in der adaptiven Umweltmodellierung schließlich 
der oben beschriebene Ansatz von Runnalls [Run07] bzw. Salmond [Sal09] 
genutzt. 


Unter diesen drei Festlegungen kann Algorithmus 2 zur Generalisierung 
der Gaußmischverteilungen von kombinierten Konzept-Attributen ein- 
gesetzt werden. Dabei werden in jedem Schritt des Algorithmus zwei 
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Komponenten der Mischverteilung durch eine neue normalverteilte Kom- 
ponente approximiert. Pro Schritt erhöht sich somit in der Regel die über 
die Kullback-Leibler Divergenz bewertete Distanz zur ursprünglichen 
Mischverteilung des Attributs. Dies wird so lange fortgesetzt, bis sich die 
reduzierte Verteilung aufgrund der wiederholten Approximationen zu stark 
von der ursprünglichen Mischverteilung unterscheidet. Dabei muss ein 
Schwellwert für den maximal erlaubten Unterschied festgelegt werden, bei 
welchem die Generalisierung abzubrechen ist. 


Grundsätzlich sollte dieser maximal erlaubte Unterschied der reduzierten 
Verteilung dabei nicht zu groß gewählt werden. Die zugrunde liegende Idee 
der Generalisierung ist es zu versuchen, Lücken in der Verteilung zu schlie- 
Ben, für welche keine Lernbeispiele vorliegen. Allerdings sollten dabei nicht 
notwendigerweise systematische Lücken geschlossen werden. Systemati- 
sche Lücken in Attributverteilungen können z.B. dadurch bedingt sein, dass 
Entitäten eines Typs Attributwerte in verschiedenen Bereichen annehmen, 
aber nicht zwischen diesen Bereichen. Dies kann der Fall sein, wenn abs- 
traktere Konzepte betrachtet werden, wie z.B. der allgemeine Begriff Löffel 
und dessen Qualität Länge. Aufgrund unterschiedlicher Unterklassen wie 
Kaffeelöffel oder Esslöffel gibt es hier z.B. zwei unterschiedliche Längen- 
bereiche, deren Lücke durch eine Generalisierung nicht notwendigerweise 
geschlossen werden soll. Abbildung 8.7 stellt einen solchen Fall abstrahiert 
dar und illustriert zugleich die Reduktion von Gaußmischdichten. 


Ein Schwellwert als Abbruchkriterium der Komponentenreduktion sollte 
i. A. also so gewählt werden, dass systematische Lücken in den Werteberei- 
chen eines Attributs erhalten bleiben, kleinere, durch fehlende Lernbeispiele 
verursachte Lücken aber geschlossen werden. Dies ist nicht immer einfach. 
Vorteilhaft für die Wahl eines Schwellwerts ist dabei, dass eine Bewertung 
der Unterschiedlichkeit von reduzierter und ursprünglicher Verteilung 
mittels Kullback-Leibler Divergenz nicht von der Skalierung der Attribute 
abhängt. Allerdings kann sich ein gewünschtes Generalisierungsergebnis 
abhängig davon unterscheiden, wie spezifisch ein Konzept ist. Für Konzepte, 
welche einen sehr spezifischen Typ von Entität beschreiben, kann dabei eine 
unterschiedlich starke Generalisierung gewünscht sein als für Konzepte, 
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welche eher abstrakte, aggregierende Entitätenstypen beschreiben. Für 
neu gelernte Konzepte wird dabei zunächst davon ausgegangen, dass ein 
spezifischer Typ von Entität repräsentiert werden soll. Weiterhin kann die 
Wahl eines Schwellwerts auch von der betrachteten Qualität eines Attributs 
und deren Bedeutung in einem Anwendungsfall abhängen. 


oO 
1 
XV 


20 4. 16 18 20 


Abbildung 8.7: Beispiel für die Komponentenreduktion einer Gaußmischverteilung. Die ur- 
sprüngliche Mischverteilung (blau) mit drei normalverteilten Komponenten 
wird dabei durch Zusammenfassung der Komponenten auf eine Verteilung 
mit zwei (violett) bzw. einer (beige) Komponenten reduziert. Die Reduktion 
auf eine einzige Komponente kann dabei für Konzept-Attribute in bestimm- 
ten Situationen, z.B. für abstraktere Konzepte, unerwünscht sein, da durch 
die resultierende Komponente auch ein Bereich von Werten in der Mitte der 
Verteilung enthalten ist, welcher nicht durch Beispiele gestützt wird. Für spe- 
zifische Konzepte kann eine solche Schließung von Lücken dagegen gerade als 
ein Generalisierungseffekt erwünscht sein. 


In [Kuw14] wurden beispielhaft die Auswirkungen der Generalisierung von 
Attributen mittels Komponentenreduktion auf die zu definierenden Kon- 
zepte untersucht. Dabei wurde betrachtet, wie sich unterschiedlich starke 
Reduktionen (gemessen in der Anzahl der verbleibenden Komponenten) auf 
relevante Eigenschaften von Konzept-Attributen für die Umweltmodellie- 
rung auswirken. Konkret wurde dabei die Verwendung der generalisierten 
Attribute in der Repräsentant-zu-Konzept Zuordnung, in Form von attribut- 
basierten Zuordnungswerten, sowie in der quantitativen Modellbewertung, 
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in Form von attributbasierten Korrespondenzwerten, betrachtet. Zu diesem 
Zweck wurden zum Vergleich unterschiedliche Verteilungen für beispiel- 
hafte Repräsentanten-Attribute genutzt. Dies waren zunächst Verteilungen, 
welche bereits von einzelnen Komponenten der ursprünglichen Verteilung 
des Konzept-Attributs abgedeckt werden konnten. Weiterhin wurden auch 
Verteilungen genutzt, welche entweder in entsprechende Lücken der ur- 
sprünglichen Verteilung fielen oder in benachbarten Bereichen lagen. Dabei 
konnte demonstriert werden, dass mit fortschreitender Reduktion z.B. 
die Zuordnung von in Lücken gelegenen Repräsentanten-Attributen zum 
Konzept-Attribut verbessert wird. Ebenso nimmt für diese die notwendige 
Beschreibung ab, wenn das reduzierte Konzept-Attribut als Modell genutzt 
wird. Wird keine zu starke Reduktion (z.B. auf nur eine verbleibende 
Komponente) durchgeführt, konnte das benachbarte Repräsentanten- 
Attribut weiterhin (z.B. durch die Repräsentant-zu-Konzept Zuordnung) 
ausreichend gut vom reduzierten Konzept-Attribut unterschieden werden. 
Weitere Einzelheiten dieser Betrachtung sind in [Kuw14] gegeben. 


Ein Beispiel dafür, wie ein neues Konzept auf Basis von schlecht beschriebe- 
nen Repräsentanten als Lernbeispielen definiert und verallgemeinert wer- 
den kann, wird im nachfolgenden Abschnitt im Rahmen des komplexeren 
Anwendungsszenarios gegeben. 


Der Ansatz der Generalisierung über eine Komponentenreduktion ist ein 
einfacher Ansatz für die adaptive Umweltmodellierung. Der Vorteil dieses 
Ansatzes ist dabei, dass er sich gut in die objektorientierte Umweltmodel- 
lierung mit ihrer Informationsrepräsentation für stetige Attribute durch 
Normalverteilungen und Gaußmischverteilungen einfügt. Insgesamt sind 
allerdings auch andere Ansätze zur Vereinfachung und Generalisierung der 
Mischverteilungen denkbar, z. B. unter Betrachtung und Approximation der 
Verteilungsfunktion der Mischverteilung. 
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8.5 Evaluation des Gesamtansatzes 


Zur Evaluation des Gesamtansatzes der adaptiven Umweltmodellierung 
samt adaptiver Modellverwaltung wurde ein zweites, komplexeres Evalua- 
tionsszenario betrachtet und definiert. In diesem Szenario wird wieder eine 
Haushaltsumgebung als Anwendungsdomäne betrachtet, in welcher ein 
humanoider Roboter Menschen bei der Durchführung von Alltagsaufgaben 
unterstützt. Im Vergleich zum bisher beschriebenen einfachen Demonstrati- 
onsszenario wird nun allerdings eine deutlich größere Anzahl an Konzepten 
im Hintergrundwissen betrachtet. Weiterhin werden die Konzepte über 
eine größere Anzahl an realistischeren Attributen beschrieben. Dennoch 
stellt auch dieses Evaluationsszenario nur einen abstrahierten Ablauf mit 
synthetischen Beobachtungen dar und verwendet keine echten Sensordaten 
eines technisch kognitiven Systems. Das Szenario und die entsprechende 
Evaluation wurde größtenteils in [Kuw16] vorgestellt. 


8.5.1 Evaluationsszenario 


Dem Szenario liegt der nachfolgend dargestellte, hypothetische Ablauf zu- 
grunde. Als technisch kognitives System wird ein humanoider Roboter be- 
trachtet, welcher eine Küche betritt. Dort beobachtet der Roboter verschie- 
dene Alltagsgegenstände, darunter Möbel wie einen Tisch und vier Stühle 
sowie einen Kühlschrank. Da der Tisch relevant für die Aufgaben des Ro- 
boters ist, nähert er sich diesem und inspiziert ihn genauer. Auf dem Tisch 
befinden sich Teller, Tafelmesser sowie eine Schale mit verschiedenen Obst- 
sorten. Daraufhin betritt ein Mensch die Küche und beginnt, den Tisch wei- 
ter zu decken. Der Roboter beobachtet nun weiteres Geschirr wie Untertas- 
sen und Tassen sowie weiteres Besteck wie Gabeln und Löffel. Auch weitere 
Obstsorten werden beobachtet. 


Im beschriebenen Ablauf werden insgesamt 29 unterschiedliche Objekte be- 
obachtet, welche 17 unterschiedlichen Typen von Entitäten angehören. Da- 
bei sind 13 Konzepte als Vorwissen bereits im Hintergrundwissensmodell 
probabilistisch modelliert. Nicht enthalten sind Konzepte für Teller sowie 
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fiir Orangen und Trauben. Beobachtete Instanzen dieser Typen stellen im 
Weltmodell also schlecht beschriebene Repräsentanten dar. 


Die modellierten Konzepte stellen dabei eine Teilmenge derjenigen Blattkno- 
ten dar, welche im in Abschnitt 4.6 beschriebenen hierarchischen Domänen- 
modell für die Haushaltsdomäne relational modelliert wurden. Somit wird 
mittels dieses Evaluationsszenarios auch ein Beispiel für die probabilistische 
Modellierung der entsprechenden Konzepte gegeben. 


Repräsentation von Konzepten 


Zur Beschreibung der Repräsentanten und Konzepte im komplexeren Eva- 
luationsszenario werden insgesamt zwölf Attribute verwendet, die unter- 
schiedliche Qualitäten repräsentieren. Als in ihrer Bedeutung interpretier- 
bare stetige Attribute werden dabei die Abmessungen von Objekten betrach- 
tet, in Form ihrer Länge, Breite und Höhe, sowie vier subsymbolische Form- 
faktoren. Als interpretierbare diskrete Attribute werden eine symbolische 
Formbeschreibung sowie die Farbe und das Material von Objekten betrach- 
tet. Für die Qualitäten Farbe und Material sind dabei jeweils zwei Attribu- 
te definiert, welche die Primär- und Sekundärfarbe eines Objekts bzw. des- 
sen Primär- und Sekundärmaterial repräsentieren. Diese Menge von Attri- 
buten wurde ausgewählt, da für sie unter Verwendung von Techniken des 
maschinellen Sehens aus entsprechenden Bilddaten, z. B. in Verbindung mit 
entsprechenden 3D-Informationen, Werte automatisiert abgeleitet werden 
können. Folglich wurden auch für die Definition des Evaluationsszenarios 
die Attributwerte einiger Repräsentanten und Konzepte bzgl. ihrer Qualitä- 
ten Farbe (mit Primär- und Sekundärfarbe) und Form (symbolisch und als 
Formfaktor) aus ausgewählten Beispielbildern automatisch extrahiert. Als 
Vorverarbeitung wurde dabei zunächst eine semi-automatische Objektseg- 
mentierung durchgeführt. 
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Probabilistische Modellierung von Konzept-Attributen 


Zur Modellierung der probabilistischen Attribute von Konzepten als Vorwis- 
sen wurde der bereits in Kapitel 4.5.2 erwähnte Ansatz einer stichprobenba- 
sierten Definition der Verteilungen gewählt. Für eine Analyse der Attribut- 
werte der Konzepte wurde daher zunächst pro Attribut und Konzept eine 
größere Menge von Beispielwerten ermittelt. Dabei wurden z. B. Produktbe- 
schreibungen und eigene Messungen für die Attribute zu den Qualitäten der 
Abmessungen und des Materials von Objekten verwendet. Weiterhin wurde 
das beschriebene Vorgehen auf Basis des maschinellen Sehens für die farb- 
und formbezogenen Qualitäten genutzt. 


Primär- und Sekundärfarbe Die Attribute Primär- und Sekundärfarbe 
wurden im Evaluationsszenario als diskrete nominale Attribute über dem 
symbolischen Wertebereich Spabe := { rot, orange, gelb, grün, blau, violett, 
braun, schwarz, grau, silber, weiß, transparent } definiert. Zur Modellierung 
der Attributverteilungen für jedes der 13 zu definierenden Konzepte wurde 
zunächst eine Stichprobe von Beispielobjekten erstellt. Die Werte für jedes 
dieser Beispielobjekte wurden nach einem gemischten Vorgehen in Abhän- 
gigkeit des Typs des Objekts ermittelt. Für menschgemachte Objekte (wie 
Möbel, Geschirr, Besteck etc.) wurden die beiden Farbwerte manuell auf Ba- 
sis von Produktbeschreibungen als deterministische Werte ermittelt. Für na- 
türliche Objekte (wie Obstsorten) wurden die Werte dagegen mit Methoden 
der digitalen Bildverarbeitung auf Basis von Beispielbildern ermittelt. Da- 
zu wurden auf einem semi-automatisiert segmentierten Bild die zwei domi- 
nantesten Farben für ein Objekt bestimmt und als Werte im HSB-Farbraum 
dargestellt. Jeder dieser Werte wurde anschließend auf den symbolischen 
Wertebereich Sfarbe abgebildet. Dazu wurde über einen funktionalen Zu- 
sammenhang für jede symbolische Farbe des Wertebereichs ihr Anteil im 
abzubildenden Farbwert berechnet. Durch Normierung ergab sich für jedes 
Beispielobjekt schließlich eine diskrete Verteilung über Sfarbe- 
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Zur Berechnung der Verteilungen der beiden Konzept-Attribute aus diesen 
Verteilungen fiir die Beispielobjekte wurde ein Vorgehen analog zum An- 
satz für das Lernen von Konzeptdefinitionen in Abschnitt 8.4.2 gewählt. Da- 
zu wurden die Verteilungen aller Beispielobjekte als eine normierte Summe 
(vgl. (8.22)) kombiniert. Eine Generalisierung für die diskreten Farbattribute 
erfolgte im Evaluationsszenario nicht. 


Primär- und Sekundärmaterial Die Attribute Primär- und Sekundärma- 
terial wurden im Evaluationsszenario als diskrete nominale Attribute über 
dem symbolischen Wertebereich Sypaterial : = { Holz, Glas, Metall, Leder, Plas- 
tik, Porzellan, Organisches } definiert. Die Attributverteilungen für die zu de- 
finierenden Konzepte wurden analog zum Vorgehen bei den Farbattributen 
für menschgemachte Objekte bestimmt. Dazu wurden pro Konzept für ver- 
schiedene Beispielobjekte deterministische Werte auf Basis von Produktbe- 
schreibungen bestimmt und diese zur Beschreibung des Konzept-Attributs 
in Form einer Häufigkeitsverteilung kombiniert. Auch für diese diskreten 
Attribute erfolgte im Evaluationsszenario keine Generalisierung. 


Form-Attribute Zur Beschreibung der Form von Objekten wurde im Eva- 
luationsszenario ein diskretes nominales Form-Attribut mit Wertebereich 
Storm i= { Ellipse3, Rechteck1, Ellipse2, Kreis, Ellipse0, Reckteck2, Ellipse1} 
definiert. Die verschiedenen Symbole fiir Ellipsen und Rechtecke beschrei- 
ben dabei jeweils unterschiedliche Orientierungen dieser Grundformen. Die 
Verteilung dieses Attributs fiir die zu definierenden Konzepte wurde analog 
zum Vorgehen bei Farbattributen als eine normierte Summe über den indivi- 
duellen Verteilungen von Beispielobjekten berechnet. Die Verteilungen fiir 
Beispielobjekte, welche in segmentierten Bildern gegeben waren, wurden 
unter Verwendung verschiedener formbezogener Maßzahlen der digitalen 
Bildverarbeitung automatisiert berechnet. Dabei wurde bewertet, zu wel- 
chem Anteil ein Objekt den durch die Symbole des Wertebereichs beschrie- 
benen (orientierten) Formen ähnelt. Diese Anteile ergaben nach Normierung 
die diskrete Attributverteilung pro Objekt. 


Weiterhin wurden vier stetige Formfaktoren definiert, welche Werte aus 
dem Intervall [0,1] annehmen können. Die Werte für diese Formfaktoren 
wurden ebenfalls automatisiert auf Basis von Beispielbildern ermittelt. Die 
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Formfaktoren unterteilen ein segmentiertes Objekt in konzentrische Ring- 
scheiben gleicher Breite aber unterschiedlichen Abstands vom Objektmittel- 
punkt. Dabei wird bewertet, wie viele der Pixel in einer solchen Ringscheibe 
jeweils vom segmentierten Objekt eingenommen werden. Diese Formfakto- 
ren stellen somit rotations- und skalierungsinvariante Merkmale dar. 


Zur Berechnung der stetigen Attributverteilungen fiir die zu definierenden 
Konzepte miissen diese Formfaktoren nun ebenfalls zu einer Wahrschein- 
lichkeitsverteilung kombiniert werden. Dabei wird nach dem Prinzip der 
Kerndichteschätzung unter Verwendung von Gaußkernen vorgegangen. Für 
jedes zu einem Konzept gehörende Beispielobjekt wird dazu ein Gaußkern 
in eine Mischverteilung eingefügt, dessen Mittelwert dem ermittelten Form- 
faktor entspricht. Dabei wird für den Extraktionsprozess der Formfaktoren 
im Evaluationsszenario eine Messunsicherheit angenommen, deren Stan- 
dardabweichung im einstelligen Prozentbereich liegt. Diese Messunsicher- 
heit wurde als Breite der Gaußkerne verwendet. 


Die sich durch die derartige Kombination der Formfaktorwerte ergebende 
Gaußmischverteilung wird anschließend durch eine Komponentenredukti- 
on generalisiert (vgl. Abschnitt 8.4.3). Dabei konnte für die meisten der be- 
trachteten Konzepte eine reduzierte Verteilung mit 1 bis maximal 2 Kompo- 
nenten je Formfaktor-Attribut erzeugt werden, welche der ursprünglichen 
Mischverteilung noch hinreichend ähnlich war. 


Objektabmessungen Zur Beschreibung der Abmessungen von Objekten 
durch ihre Länge, Breite und Höhe wurde jeweils ein Wertebereich von 0- 
300 cm angenommen. Die Werte für die Beispielobjekte pro Konzept wurden 
hier ebenfalls aus Produktbeschreibungen entnommen. Zur Erzeugung der 
kombinierten Verteilung aus den Werten der Beispielobjekte wurde derselbe 
Ansatz wie für die Formfaktoren verwendet. Als Breite der Gaußkerne wur- 
den hier Abweichungen im einstelligen Zentimeterbereich angenommen. 
Auch diese Konzept-Attribute wurden nach dem in Abschnitt 8.4.3 vorge- 
schlagenen Ansatz generalisiert. In Abhängigkeit der Spezifität eines Kon- 
zepts ergaben sich für die Generalisierung unterschiedliche Ergebnisse, was 
die Anzahl der in der reduzierten Verteilung verbleibenden Komponenten 
betraf. Gerade die Konzepte für stärker heterogene Objekttypen wie Tische 
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oder Kühlschränke mussten dabei in ihren Abmessungen über eine höhe- 
re Anzahl an Komponenten beschrieben werden. Abbildung 8.8 stellt bei- 
spielhaft die sich nach der Generalisierung ergebenden Verteilungen für die 
Breite von Tischen und die Höhe von Kühlschränken dar. Bei der Festlegung 
des Schwellwerts zum Abbruch der Komponentenreduktion muss dabei ein 
Kompromiss zwischen Generalisierungsfähigkeit des Konzept-Attributs und 
Spezifität seiner Beschreibung getroffen werden. 
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(a) Breite des Konzepts Tisch (b) Höhe des Konzepts Kühlschrank 


Abbildung 8.8: Modellierte Verteilungen für die Breite eines Konzepts Tisch und die Höhe 
eines Konzepts Kühlschrank. Die Verteilungen wurden mittels das Ansatzes 
einer Kerndichteschätzung als Mischverteilungen erzeugt und anschließend 
mit dem beschriebenen Generalisierungsansatz durch Komponentenredukti- 
on verallgemeinert. 


Festlegung von A-priori-Verteilungen 


Auf Basis der modellierten Konzepte können nun pro Qualität A-priori- 
Verteilungen definiert werden, wie sie z.B. in der erweiterten alternativen 
Repräsentant-zu-Konzept Zuordnung (vgl. Abschnitt 6.4) eingesetzt wer- 
den. Für das Evaluationsszenario wurde für stetige Attribute dazu eine 
normierte Summenverteilung über alle modellierten Konzept-Attribute der 
entsprechenden Qualität erzeugt und anschließend generalisiert. Abbil- 
dung 8.9 zeigt die resultierenden generalisierten Gaußmischverteilungen 
für die Qualitäten Länge und Breite. Als Abbruchkriterium der Kompo- 
nentenreduktion wurde hierbei ein disjunktives Kriterium aus minimaler 
verbleibender Komponentenanzahl und maximaler Abweichung von der 
ursprünglichen Verteilung gewählt. Für diskrete Attribute wurden entweder 
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eine Gleichverteilung über dem entsprechenden Wertebereich oder eine 
normierte Summenverteilung ohne Generalisierung als A-priori-Verteilung 


genutzt. 
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(a) A-priori-Verteilung für die Qualität Länge (b) A-priori-Verteilung für die Qualität Breite 


Abbildung 8.9: Durch Generalisierung erzeugte A-priori-Verteilungen für die Qualitäten Län- 
ge und Breite, wie sie im komplexeren Evaluationsszenario genutzt werden. 
Dazu wurde zunächst über die Attributverteilungen aller Konzepte für die 
entsprechende Qualität eine normierte Summe gebildet, welche anschließend 
durch Komponentenreduktion generalisiert wurde. 


Simulationsparameter des Evaluationsszenarios 


Das Szenario wurde über 43 Zeitschritte simuliert, wobei sich der Ablauf 
abstrahiert wie oben beschrieben ergibt. Als initiales Hintergrundwissen 


wurde die Menge 


G:s { Tisch, Stuhl, Kühlschrank, Tasse, Untertasse, Löffel, Gabel, Messer, 
Apfel, Banane, Birne, Erdbeere, Kokosnuss } 


der 13 definierten Konzepte verwendet. Zu jedem Zeitpunkt wird die Beob- 
achtung von maximal einer Entität verarbeitet. Dabei werden analog zum 
bisherigen Vorgehen größtenteils Zeitschritte dargestellt, in welchen neue 
Repräsentanten ins Weltmodell aufgenommen werden. Weiterhin sind zum 
Teil auch Zeitschritte im Szenario enthalten, in welchen keine Beobachtun- 
gen gemacht werden. Im Zeitschritt t = 1 wird z. B. keine Entität beobachtet 
und das Weltmodell enthält dementsprechend noch keine Repräsentanten. 
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Anschließend werden in den nächsten Zeitschritten analog zum beschriebe- 
nen Ablauf folgende Objekte beobachtet: 
e ein Tisch (t = 2), 
e vier Stühle (t = 3,4, 6, 7), 
e ein Kühlschrank (t = 9), 
zwei Teller (t = 11, Teller-1 und t = 14, Teller-2), 
e zwei Messer (t = 12, 15), 
zwei Apfel (t = 17, 22), 
e eine Birne (t = 18), 
e drei Bananen (t = 19, 23, 24), 
e eine Orange (t = 21, Orange-1), 
e zwei Tassen (t = 26, 27), 
e zwei Untertassen (t = 29, 30), 
e zwei Löffeln (t = 32, 33), 
e zwei Gabeln (t = 35, 36), 
e zwei Orangen (t = 38, Orange-1’ und t = 39, Orange-2) und 
e zwei Trauben (t = 41, Traube-1 und t = 42, Traube-2). 


Schlecht beschriebene Repräsentanten in Bezug auf die Konzeptmenge C 
sind in obiger Aufzählung explizit benannt und angegeben. Sie treten in den 
Zeitschritten t = 11,14, 21, 38, 39,41 und t = 42 auf. Im Zeitschritt t = 43 
wird eine Modellanpassung durchgeführt und ein neu gelerntes Konzept (für 
Orangen) in das Hintergrundwissen € aufgenommen. 


Als ein weiterer Parameter des Evaluationsszenarios wurde der Ansatz der 
Post-Skalierung nach Gleichung (6.10) zur Berechnung der Repräsentant- 
zu-Konzept Zuordnung verwendet. Weiterhin wurde für die Diskretisierung 
stetiger Attribute als kleinster unterscheidbarer Betrag ein Wert von 
A =1cm für Objektabmessungen und von A = 0.025 für Formfaktoren 
genutzt. 
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8.5.2 Ergebnisse 


Für das komplexere Evaluationsszenario wurde über den Verlauf der 43 Zeit- 
schritte die Modellgüte bewertet, die jeweils beobachteten Repräsentanten 
Konzepten zugeordnet sowie schlecht beschriebene Repräsentanten detek- 
tiert und gespeichert. Schließlich wurde die Notwendigkeit einer Modellan- 
passung festgestellt und diese durchgeführt. 


Quantitative Modellbewertung 


Die Ergebnisse der quantitativen Modellbewertung sind in Abbildung 8.10 
dargestellt. Dabei ist als Erstes zu erkennen, dass die Konzeptdefinitionen 
mit einer realistischeren Anzahl an Attributen deutlich höhere Komplexi- 
tätswerte erreichen als im einfachen Demonstrationsszenario. Die Werte lie- 
gen dabei um bis zu zwei Größenordnungen höher. Beispielwerte für ausge- 
wählte Konzepte sind in Tabelle 8.1 dargestellt. 


— Modellgüte Q(R , C ) 
1000-| — Modellkorrespondenz L(R |C) Je 
; — Relative Entropiedifferenz M(-) 
Hi — Alternative Entropiedifferenz M,(-) f 


Zeitschritt 
n n n i n n n n TS len 
0 10 20 30 40 


Abbildung 8.10: Ergebnisse der quantitativen Modellbewertung und Detektionsmaße im kom- 
plexeren Evaluationsszenario über 43 Zeitschritte. 
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Tabelle 8.1: Komplexitätswerte für vier ausgewählte Konzepte im komplexeren Evaluations- 
szenario. 


Konzept Komplexität 


Tisch 23.4 
Untertasse 30.5 
Erdbeere 31.8 
Gabel 35.4 


Neben der Konzeptkomplexität steigen aufgrund der komplexeren Modellie- 
rung in Abbildung 8.10 auch die Korrespondenzwerte von Repräsentanten zu 
Konzepten an. Dabei erhöht sich die Beschreibungslänge für Repräsentanten 
unter Verwendung der Konzepte als Modelle analog zur Konzeptkomplexität 
bei einer gesteigerten Anzahl an verwendeten Attributen. Unabhängig von 
dieser höheren Skalierung der Modellgüte verlaufen die beiden dargestell- 
ten Gütemaße der quantitativen Modellbewertung ähnlich wie im einfachen 
Demonstrationsszenario. Somit skaliert die quantitative Modellbewertung 
auch für das komplexere Szenario gut. Über die ersten zehn Zeitschritte ist 
dabei ein leichtes Ansteigen des Modellgütemaßes zu erkennen, verursacht 
jeweils durch die zusätzlich notwendige Beschreibung für den aktuell beob- 
achteten, gut durch das Hintergrundwissen beschriebenen Repräsentanten. 
Ähnliches gilt für die weiteren Zeitschritte, in welchen keine schlecht be- 
schriebenen Repräsentanten vorliegen. 


Detektion schlecht beschriebener Repräsentanten 


Abbildung 8.10 zeigt ebenfalls die Werte der relativen Entropiedifferenz M(-) 
als Detektionsmaß für schlecht beschriebene Repräsentanten sowie des al- 
ternativen Detektionsmaßes M;(-). In den Zeitschritten t = 11,14,21 wer- 
den die ersten drei schlecht beschriebenen Repräsentanten durch beide De- 
tektionsmaße erkannt. Dies ist in der Abbildung jeweils durch einen Aus- 
schlag der Maße gegen 0 zu erkennen. Die dargestellten Werte des normier- 
ten alternativen Detektionsmaßes M;(-) sind in der Abbildung aus Gründen 
der Erkennbarkeit mit einem Faktor von 25 skaliert. Auch die am Ende des 
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Szenarios in den Zeitschritten t = 38,39,41,42 auftretenden schlecht be- 
schriebenen Repräsentanten können detektiert werden. Für die direkt davor 
in Zeitschritt t = 36 beobachtete zweite Gabel (Gabel-2) ist eine Unterschei- 
dung auf Basis der relativen Entropiedifferenz M(-) allerdings schwieriger. 
Durch das alternative Detektionsmaß M>(-) ist diese Unterscheidung dage- 
gen deutlich einfacher. Insgesamt ergibt sich als Detektionsergebnis im Zeit- 
schritt t = 42 die Liste von schlecht beschriebenen Repräsentanten als 


Sg = {Teller-1, Teller-2, Orange-1, Orange-2, Orange-1’, Traube-1, Traube-2}. 


Modellanpassung 


Im Zeitschritt t = 42 überschreitet der Wert der Modellgüte den Schwellwert 
fiir eine tolerierbare Zunahme. In Folge dessen wird eine Modellanpassung 
angestoßen auf Basis der gespeicherten schlecht beschriebenen Repräsen- 
tanten Sg. Dazu wird zunächst einer dieser Repräsentanten als der Kanditat 
s* für eine Modellanpassung ausgewählt. Dies kann über eine Bewertung 
der Relevanz (8.19) aller schlecht beschriebenen Repräsentanten oder über 
die Bewertung ihrer geschätzten Nützlichkeit (8.20) erfolgen. Die Ergebnisse 
für beide Ansätze im Evaluationsszenario sind in Tabelle 8.2 dargestellt. 


Tabelle 8.2: Relevanz und prädizierte Nützlichkeit von schlecht beschriebenen Repräsentan- 
ten im komplexeren Evaluationsszenario. Fett dargestellt ist der jeweils am besten 
bewertete Repräsentant, welcher als Kandidat s* für eine Modellanpassung aus- 
gewählt wird. 


Repräsentant Relevanz Nützlichkeit 


Teller-1 2 96.4 

Teller-2 2 95.3 

Orange-1 3 275.4 
Orange-2 3 143.4 
Orange-1’ 3 275.4 
Traube-1 2 141.2 
Traube-2 2 139.1 
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In beiden Ansätzen wird der Repräsentant Orange-1 als Kandidat s* aus- 
gewählt. Als Schwellwert für die Relevanzbewertung wurde dabei ein 
Vielfaches der durchschnittlichen Konzeptkorrespondenz für die bisher be- 
obachteten gut beschriebenen Repräsentanten gewählt. Konkret wurde das 
Zehnfache genutzt, womit sich ®4 = 23.6 ergibt. Für diesen Kandidaten- 
Repräsentanten müssen nun weiterhin Lernbeispiele gefunden werden. 
Unter Anwendung des vorgeschlagenen Vorgehens (8.21) ergibt sich dabei 
die Menge 


Se =  { Orange-1, Orange-2, Orange-1’} , 


wobei zur Bewertung der Ähnlichkeit von Repräsentanten eine Zuordnung 
nach dem Ansatz der Prä-Skalierung (6.9) genutzt wurde. Dabei wurde ein 
Schwellwert von ®& = 0.75 verwendet. Dieser Schwellwert beschreibt 
beim Ansatz der Prä-Skalierung ein Vielfaches des kombinierten Basiswerts 
der Zuordnung. Die gewählten Lernbeispiele dienen dann als Grundlage, 
um mit dem in Abschnitt 8.4 beschriebenen Vorgehen ein neues Konzept 
zu erlernen. Für die Generalisierung der stetigen Attribute wird dabei ein 
Schwellwert von 1 (maximale Kullback-Leibler Divergenz zur urspriingli- 
chen Mischverteilung) als Abbruchkriterium der Komponentenreduktion 
genutzt. Dieses neu erlernte Konzept wurde in Zeitschritt t = 43 der Kon- 
zeptmenge C hinzugefügt. In Abbildung 8.10 ist zu erkennen, dass durch 
diese Modellanpassung eine signifikante Verbesserung der Modellgüte 
erreicht werden kann (durch das Absinken der Modellgütewerte). Das neu 
erlernte Konzept trägt dabei mit einer Konzeptkomplexität von 32.2 zur 
neuen Modellkomplexität bei. 


Betrachtung der Repräsentant-zu-Konzept Zuordnung 


Die Repräsentant-zu-Konzept Zuordnung stellt einen wichtigen Bestandteil 
der Verfahren der quantitativen Modellbewertung und der adaptiven Wis- 
sensverwaltung dar, z.B. als Ausgangswert für Detektionsmaße. Daher soll 
diese Zuordnung auch im komplexeren Evaluationsszenario nochmals ge- 
nauer betrachtet und evaluiert werden. 
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Abbildung 8.11 stellt zu diesem Zweck Zuordnungsergebnisse fiir unter- 
schiedliche Repräsentanten des komplexeren Szenarios dar. In den beiden 
Teilabbildungen 8.11a und 8.11b sind die Zuordnungsverteilungen für zwei 
Repräsentanten dargestellt, für welche Konzepte im Hintergrundwissen ent- 
halten sind. Beide Repräsentanten werden wie gewünscht eindeutig zuge- 
ordnet. In den nächsten beiden Teilabbildungen 8.11c und 8.11d sind Zu- 
ordnungsverteilungen für schlecht beschriebene Repräsentanten dargestellt. 
Auch diese fallen im komplexeren Evaluationsszenario wie gewünscht in- 
konklusiv aus. In den beiden Teilabbildungen 8.11e und 8.11f sind die Zu- 
ordnungsverteilungen für zwei Gabeln dargestellt. Dabei ist zu erkennen, 
dass die Zuordnung von Gabel-2 nicht mehr so eindeutig ist wie dies für an- 
dere Repräsentanten der Fall war. Gabel-2 ist auch derjenige Repräsentant, 
für welchen die relative Entropiedifferenz als Detektionsmaß in Zeitschritt 
t = 36 Schwierigkeiten hatte. 


Begründet liegt dieses schlechtere Zuordnungsergebnis darin, dass sich die 
verschiedenen Konzepte für Besteck (Löffel, Gabel, Messer) sehr stark in ihrer 
Definition ähneln, und eine Unterscheidung aufgrund von Attributverteilun- 
gen in diesem Fall schwierig sein kann. Eine solche Situation kann auch für 
andere Konzepte auftreten, wenn die Anzahl der insgesamt im Hintergrund- 
wissen betrachteten Konzepte stärker ansteigt und sich Gruppen ähnlicher 
Konzepte herausbilden. 


Problematisch kann dabei auch die Detektion von schlecht beschriebenen 
Repräsentanten sein, die eigentlich zu einem Konzept einer solchen Grup- 
pe gehören, welches aber nicht im Hintergrundwissen enthalten ist. Hierbei 
kann sich die Wahrscheinlichkeitsmasse dann auf den Konzepten der Grup- 
pen verteilen, und nicht wie gewünscht über allen Konzepten. Ein Beispiel 
dafür wird in [Kuw16] gegeben. Dies zeigt auch die Grenzen einer attribut- 
basierten Konzeptbeschreibung in Verbindung mit einer Repräsentant-zu- 
Konzept Zuordnung als Klassifikationsansatz auf. Ein möglicher Ausweg be- 
steht in der Verwendung eines hierarchischen Klassifikators, der Repräsen- 
tanten zunächst nur der Oberklasse eines solchen Konzepts zuordnet, und 
in dieser in einem weiteren Schritt danach genauer unterscheidet. Dieser 
Aspekt geht allerdings über den Umfang dieser Arbeit hinaus. 
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Summen-A-priori-Verteilungen 


(h) Traube-1 mit generalisierter 


Beispiele für die Repräsentant-zu-Konzept Zuordnung im komplexeren Eva- 


luationsszenario. 


A-priori-Verteilungen 


(g) Traube-1 mit Gleichverteilung als 


Abbildung 8.11 
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Die letzte Reihe in Abbildung 8.11 illustriert den Effekt der Verwendung un- 
terschiedlicher A-priori-Verteilungen auf die Zuordnungsergebnisse. In Teil- 
abbildung 8.11g wird dabei eine Zuordnungsverteilung fiir einen schlecht 
beschriebenen Repräsentanten gezeigt, wenn als A-priori-Verteilungen für 
alle Attribute Gleichverteilungen über den jeweiligen Wertebereichen ange- 
nommen werden. Dagegen zeigt 8.11h die sich ergebende Zuordnung, wenn 
zumindest für die stetigen Attribute generalisierte Summenverteilungen als 
A-priori-Verteilungen genutzt werden. 


8.6 Zusammenfassung 


In diesem Kapitel wurde eine adaptive Modellverwaltung vorgestellt, wel- 
che das Analogon der Hintergrundwissens-Komponente zur Informations- 
verwaltung in der Weltmodell-Komponente darstellt sowie eine Umsetzung 
der adaptiven Umweltmodellierung beschreibt. Zu diesem Zweck wurden 
verschiedene Detektionsmaße für schlecht beschriebene Repräsentanten de- 
finiert und ein gesamtheitlicher Ablauf für eine adaptive Modellverwaltung 
in Form einer Regelschleife vorgestellt. Als wichtiger Teilschritt wurde u.a. 
die Auswahl von relevanten Lernbeispielen für Modellanpassungen präsen- 
tiert, basierend auf bereits zuvor definierten Bewertungsmaßen. Weiterhin 
wurde das Vorgehen für das Erlernen und Generalisieren neuer Konzeptdefi- 
nitionen in der adaptiven Umweltmodellierung dargelegt. Schließlich wurde 
diese adaptive Modellverwaltung und ihre Verfahren anhand eines komple- 
xeren Evaluationsszenarios demonstriert und evaluiert. 
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9.1 Zusammenfassung 


In dieser Arbeit wurde ein Ansatz fiir eine adaptive Umweltmodellierung 
vorgestellt. Diese stellt eine Erweiterung der objektorientierten Umweltmo- 
dellierung dar. Die adaptive Umweltmodellierung betrachtet dabei die Pro- 
blemstellung, die objektorientierte Umweltmodellierung fiir offene Welten 
zu erweitern und dieser einen Umgang mit potentiell unvorhergesehenen 
Arten von Objekten zu ermöglichen. Die objektorientierte Umweltmodellie- 
rung basiert konzeptuell auf der Verwendung eines semantischen Domänen- 
modells, in welchem für domänenrelevante Entitäten ihre aufgabenbezoge- 
ne Bedeutung modelliert wird. Derartige Domänenmodelle werden a priori 
von Wissensingenieuren erstellt. Im Betrieb eines Umweltmodells werden 
Entitäten in einer relevanten Umgebung beobachtet und mit den semanti- 
schen Konzepten des Domänenmodells verknüpft. Die adaptive Umweltmo- 
dellierung betrachtet nun den Fall, dass Entitäten in der Umgebung beob- 
achtet werden, für welche im Domänenmodell bisher keine Konzepte mo- 
delliert sind. 


Diesbezüglich wurde in dieser Arbeit ein Ansatz für eine quantitative Bewer- 
tung der Güte eines Domänenmodells entwickelt. Dieser Ansatz bewertet 
dabei die Fähigkeit eines Modells, die in der Umgebung beobachteten Enti- 
täten erklären und beschreiben zu können. Dazu wurde ein Vorgehen nach 
dem Prinzip der minimalen Beschreibungslänge für eine Anwendung in der 
objektorientierten Umweltmodellierung übertragen und detailliert. Das ent- 
wickelte Bewertungsmaß berücksichtigt und bewertet dabei in gleichen Tei- 
len die Komplexität eines Domänenmodells als auch dessen Fähigkeit, beob- 
achtete Entitäten erklären zu können. 
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Die quantitative Modellbewertung dient in dieser Arbeit weiterhin als eine 
Grundlage zur Steuerung von Modellanpassungen. Zu diesem Zweck wur- 
de zusätzlich ein übergeordneter Ansatz entwickelt, welcher eine adaptive 
Verwaltung und Anpassung von Domänenmodellen umsetzt. Ein Ziel die- 
ses Ansatzes ist es, Anpassungen an Domänenmodellen nach Prinzipien wie 
der Bedarfsgerechtigkeit und der Relevanz von Änderungen durchzuführen. 
Dazu werden im entwickelten Ansatz zunächst die über die Zeit aufgetre- 
tenen, schlecht durch ein Domänenmodell beschriebenen Entitäten gespei- 
chert. Mittels eines unüberwachten Selektions- und Gruppierungsansatzes 
wird daraus eine Menge von Lernbeispielen ausgewählt, die einen für das 
Umweltmodell relevanten neuen Typ von Entität beschreiben. Auf Basis die- 
ser Lernbeispiele werden schließlich neue probabilistische Konzeptbeschrei- 
bung gelernt. Dazu wurde in dieser Arbeit ein Vorgehen entwickelt, welches 
auch eine Generalisierung gelernter Konzepte erlaubt. 


Um durch eine solche induktive Inferenz neue Konzeptbeschreibungen für 
die objektorientierte Umweltmodellierung erzeugen zu können, wurde in 
dieser Arbeit weiterhin ein Metamodell und eine Kern-Ontologie für Domä- 
nenmodelle entworfen und in der Beschreibungslogik OWL 2 DL umgesetzt. 
Als Herausforderung mussten dabei im Speziellen die probabilistischen At- 
tribute der Konzepte und die probabilistischen Relationen zwischen Kon- 
zepten mittels Beschreibungslogik repräsentiert werden. Weiterhin wurde 
ein beispielhaftes Modell für die Haushaltsdomäne auf Grundlage der ent- 
wickelten Kern-Ontologie realisiert. 


Zusätzlich wurden in dieser Arbeit weitere Anpassungen und Erweiterun- 
gen der probabilistischen Informationsverarbeitung im objektorientierten 
Umweltmodell vorgenommen, welche zur Ermöglichung der adaptiven Um- 
weltmodellierung notwendig waren. Dazu zählt die Entwicklung eines alter- 
nativen Ansatzes, um beobachtete Entitäten probabilistisch den Konzepten 
des Domänenmodells zuordnen zu können sowie eine Erweiterung des An- 
satzes zur Datenassoziation im objektorientierten Umweltmodell. 
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9.2 Ausblick 


In dieser Arbeit wurde ein erster Ansatz zur Erweiterung der objektori- 
entierten Umweltmodellierung für offene Welten vorgestellt. Dabei wurde 
ein grundlegendes Vorgehen für eine adaptive Umweltmodellierung entwi- 
ckelt und demonstriert. Bei der Entwicklung dieses Ansatzes wurden nun 
auch Aspekte aufgezeigt, welche im Rahmen dieser Arbeit nicht vertieft be- 
trachtet werden konnten und somit mögliche Anteile für zukünftige Arbei- 
ten darstellen. Zum Beispiel wurden in der quantitativen Modellbewertung 
und Repräsentant-zu-Konzept Zuordnung in dieser Arbeit nur flache Wis- 
sensmodelle betrachtet, welche sich durch eine Art Projektion eines hierar- 
chischen Wissensmodells auf dessen Blattknoten ergaben. Ein darüber hin- 
ausgehender, interessanter Aspekt für zukünftige Arbeiten wäre die direkte 
quantitative Gütebewertung eines hierarchischen Wissensmodells, vor al- 
lem in Bezug auf eine hierarchische Komplexitätsbewertung. Eng damit ver- 
bunden ist auch die Frage, ob bei Vorliegen des Bedarfs für eine Modellan- 
passung ein gänzlich neues Konzept erstellt oder ein existierendes Konzept 
erweitert werden soll. Dieser Aspekt wurde in der vorliegenden Arbeit nur 
oberflächlich betrachtet. Eine hierarchische Modellbewertung könnte dabei 
genutzt werden, um zu entschieden, ob entweder ein existierendes Kind- 
konzept erweitert, ein neues Kindkonzept erstellt oder das entsprechende 
Vaterkonzept erweitert werden sollte, im Sinne einer minimalen Gesamt- 
beschreibungslänge für das Wissensmodell und die Repräsentanten. Auch 
dieser Aspekt stellt eine interessante zukünftige Fragestellung dar. 


Gleiches gilt für die Frage, ob und an welcher Stelle ein neu gelerntes 
Konzept in ein hierarchisches Wissensmodell möglichst automatisiert 
eingehängt werden kann. Auch dieser Aspekt wurde in der vorliegenden 
Arbeit nicht vertieft betrachtet und könnte über eine hierarchische Modell- 
bewertung adressiert werden. Ebenfalls könnte der Aspekte über Methoden 
des Ontologie-Lernens adressiert werden. Eine genauere Untersuchung 
diesbezüglich stellt somit ebenfalls eine mögliche Erweiterung dieser Arbeit 
dar. Auch die Integration von Methoden des Ontologie-Lernens zur seman- 
tischen Vervollständigung von neu gelernten Konzepten mit zusätzlichen 
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Attributen stellt eine interessante zukünftige Erweiterung der adaptiven 
Umweltmodellierung dar. 


In dieser Arbeit wurde prinzipiell versucht, die fiir entwickelte Verfahren 
notwendigen Parameter wie z.B. Schwellwerte möglichst automatisiert 
oder, wenn dies nicht möglich war, wenigstens interpretierbar aus model- 
liertem Vorwissen bzw. über die Zeit erworbenen Umgebungsinformationen 
abzuleiten. Dies sollte über ein Anwendungsmodell hinaus so weit wie mög- 
lich unabhängig von einem konkreten Anwendungsfall erfolgen. Allerdings 
konnte dieser Aspekt in der vorliegenden Arbeit nicht für die Parameter 
und Schwellwerte aller Verfahren gleichermaßen umfassend betrachtet 
werden, so dass sich auch hier zukünftige Arbeiten anschließen können. 
Dabei kann die grundlegende Frage betrachtet werden, nach welchem 
Vorgehen Parameter von Verfahren in der objektorientierten und adaptiven 
Umweltmodellierung auf Basis eines Domänenmodells und beobachteter 
Informationen automatisiert abgeleitet werden können. 


In der objektorientierten und adaptiven Umweltmodellierung wird an- 
genommen, dass Domänenmodelle zunächst von menschlichen Experten 
erstellt und anschließend bei Bedarf von einem technisch kognitiven System 
erweitert werden. Eine zusätzliche interessante Fragestellung ergibt sich 
nun, wenn mehrere kooperierende kognitive System in einem Anwen- 
dungsfall zusammenarbeiten. In diesem Fall kann es passieren, dass die 
einzelnen Systeme jeweils individuelle Modellanpassungen durchführen. 
Wie solche individuellen Modellanpassungen zu einem konsistenten Ge- 
samtmodell zusammengeführt werden können, stellt somit ebenfalls einen 
interessanten zukünftigen Forschungsaspekt dar. 
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In dieser Arbeit wird ein Ansatz zur adaptiven Umweltmodellierung für 
kognitive Systeme vorgestellt. Der Ansatz erweitert die objektorientierte 
Umweltmodellierung, in welcher Umgebungsinformationen schritthaltend 
erfasst und einem vorab definierten Domänenmodell zugeordnet werden. 
Im Betrieb kann dieses Domänenmodell jedoch für unvorhergesehen auftre- 
tende Entitäten unzureichend sein. Der vorgestellte Ansatz adressiert daher 
eine adaptive Verwaltung und Erweiterung des Domänenmodells unter 
Beachtung der Bedarfsgerechtigkeit und Relevanz von Modellanpassungen. 
Als Grundlage dafür dient eine quantitative Modellbewertung nach dem 
Prinzip der minimalen Beschreibungslänge, die die Repräsentationsfähigkeit 
eines Modells in Bezug auf den aktuellen Umgebungszustand bewertet. 
Auch werden ein Metamodell und eine Kern-Ontologie definiert, welche 
die Rahmenbedingungen für Modellanpassungen festlegen. Schließlich 
wird ein Regelungsschema vorgeschlagen, welches die bedarfsgetriebene 
Anpassung des Domänenmodells an relevante neue Entitäten durch das 
Erlernen von probabilistischen Konzeptdefinitionen ermöglicht. 
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